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1. DEFINICION, MOTIVACION Y ORIGEN 
DE LOS SISTEMAS EXPERTOS 

1.1. SISTEMAS CON BASE DE CONOCIMIENTOS 

Sistema computacional que ejecuta un proceso de razonamiento similar al que realiza un experto 
humano dentro de un dominio limitado del saber. 

Generalmente, en la actualidad, los Sistemas Expertos ( SS. EE. ) se implementan con software, 
utilizando una Base de Conocimientos y un Mecanismo de Inferencia para modelar el razonamiento del 
experto, aunque se está comenzando a implementar SS. EE. basados en Redes Neuronales, 
inspiradas en lo que se conoce sobre la arquitectura y funcionamiento de los cerebros biológicos. 

El término "Sistema con Base de Conocimientos" o "Sistema Basado en Conocimientos" (inglés: 
"Knowledge-Based System") se usa a veces como sinónimo de Sistema Experto (S. E.), y a veces en 
un sentido más general o para no hacer alusión a algún paralelo con el desempeño de un experto 
humano. 


1.2. APLICACIONES TIPICAS 

Los SS.EE. Proporcionan una tecnología adecuada para automatizar procesos de razonamiento para 
resolver problemas en los cuales no es adecuada una metodología de computación más tradicional. 

Los problemas en los cuales ha resultado más efectivo aplicar la tecnologia de los SS. EE., 
generalmente pertenecen a los siguientes tipos, aclarando que algunos de estos tipos están muy 
relacionados, y por lo tanto un sistema dado puede considerarse como perteneciente simultáneamente a 
varios tipos: 

- Clasificación o Interpretación : 

- Diagnóstico : Técnico o Médico 

- Predicción y previsión Ej: para mantenimiento preventivo. 

- Diseño o Configuración de equipos o sistemas 

- Planeación 

- Monitoreo y Control 

- Vigilancia y alarma 

- Instrucción 


1.3. PROGRAMA TRADICIONAL vs. SISTEMA EXPERTO 

Existen tareas difíciles de automatizar y problemas difíciles de resolver por los métodos 
computacionales tradicionales. Algunas de las causas de esto son: 

- El fenómeno de explosión combinatoria 

El crecimiento desmesurado del número de estados posibles de un sistema, o del número 
de alternativas a considerar para resolver un problema 


- Los dominios no estructurados 
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Aquellos para los cuales no se dispone de teorías o modelos causales detallados, ni 
métodos matemáticos suficientes para aplicar algoritmos que garanticen soluciones 
satisfactorias. 

- La necesidad de sentido común 

La necesidad de aplicar gran cantidad de conocimientos, adquiridos durante la vida y que 
aplicamos de manera natural, casi sin darnos cuenta, pero que no los tenemos bien 
definidos ni formulados explícitamente. 

Los SS.EE. utilizan conoci mi entos denominados "heurísticas", o "reglas heurísticas" para hacer 
manejables los problemas, y atacar las mencionadas dificultades. 

Sinembargo, por ejemplo, la implementación de un sistema para diagnóstico, con una programación 
tradicional, podría ser : 

Begin 

Nombre := ask("Nombre ? ") 

Edad := ask("Edad ? ") 


Sintoma_l := ask("Sintoma ? ") 

• • • • 

if GRAMNEG in SINTOMAS then 
Begin 

forma := ask("Morfología ? ") 
if forma := "COCUS" then 
Begin 

fiebre := ask("Ha tenido ... 
if fiebre := "SI" then 


Este tipo de implementación presenta dificultades como las siguientes: 

1- Es difícil evaluar lo que "sabe" el sistema. 

2- Es engorroso modificarlo o actualizarlo, es demasiado rígido. 

3- Que pasa con la inexactidud e icertidumbre inherentes a los conocimientos, en general ? 

Estos problemas surgen en gran medida porque en este caso se están mezclando los "conocimientos" 
con el "procedimiento lógico". 

Un aporte metodológico fundamental hecho por los SS.EE. es el concepto de separación del 
"conocimiento", el cual se organiza en una estructura denominada BASE DE CONOCIMIENTOS 
(B.C.) , y el "procedimiento lógico" implementado en un MECANISMO DE INFERENCIA (M.I.). 


c 


MECANISMO DE INFERENCIA 
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BASE DE CONOCIMIENTOS 
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1.3.1 DIFERENCIAS ENTRE UN PROGRAMA CONVENCIONAL Y UN SISTEMA EXPERTO 


SISTEMA CONVENCIONAL 

SISTEMA EXPERTO 

Conocimiento y Lógica de Proceso 
mezclados en un programa 

Base de Conocimientos y Macanismo de Inferencia 
separados . 

No explican porqué se necesitan los 
datos ni porqué se llegó a un resul¬ 
tado 

Lo explican 

Es difícil efectuar cambios en los 
conocimientos programados. 

Es más fácil modificar la Base de Conocimientos 

Necesitan información completa 
para operar 

Deben se más tolerantes para operar aún con alguna 
información desconocida 

Generalmente manejan datos 
cuantitativos 

Manejan datos cualitativos primordialmente 

Captura, amplifica y distribuye el 
acceso a datos numéricos o textuales 

Captura, amplifica y distribuye el acceso a juicios 
basados en conocimientos 


1.4. DESARROLLO HISTORICO DE LOS SS.EE. 

Los SS. EE. son un producto de la investigación en Inteligencia Artificial. 

La investigación en I. A. inicialmente estuvo muy centrada en el estudio de métodos formales de 
búsqueda y solución de problemas. Los SS.EE. se desarrollan a mediados del decenio 1960-1970, al 
reconocerse la importancia primordial que tienen los conocimientos particulares de un dominio para 
que los métodos formales de búsqueda e inferencia sean eficaces en la solución de problemas. 

El concepto de S.E. fué formulado por primera vez por Edward Feigenbaum en el congreso 
internacional de I.A. de 1977 (IJCAI 77 = International Joint Conference on A. I.). El desarrollo en 
sí de esta arquitectura y metodología se puede caracterizar en las siguientes etapas: 


1- INVENCION : Al aumentar el número de reglas heurísticas que se debía incluir 

en un sistema, estas van tomando "identidad" como Bases de 
Conocimientos. Tal es el caso de DENDRAL y MACSYMA. 
Epoca: 1965-1970 


2- PROTOTIPOS: 


Una vez constatada la viabilidad del concepto, se producen 
desarrollos según distintos criterios de estructuración y proceso 
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de el conocimiento. Los sistemas significativos de esta etapa 
son: CASNET, MYCIN, HEARSAY II y PROSPECTOR. 
Esto ocurre entre 1970 y 1977 

3-EXPERIMENTACION: 1977-1981; Se aplican los conceptos de los S.E. a distintas 

áreas: Las ideas de CASNET se utilizan en INTERNIST, las 
de MYCIN en PUFF, GUIDON y SACON, las de 
PROSPECTOR en HYDRO, las de HEARSAY II en 
HEARSAY m y HASP. 



También en esta etapa se producen los primeros intentos de 
formalizar la construcción de SS.EE. mediante herramientas 
para el desarrollo, produciéndose, por ejemplo: 
METADENDRAL, a partir de DENDRAL; TEIRESIAS, 
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EMYCIN, RITA y ROSIE a partir de MYCIN; KAS 
derivado de PROSPECTOR, y el sistema AGE derivado de 
HEARSAYII. 
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4- INDUSTRIALIZACION: Se expande hacia las empresas la utilización de la tecnología de 

SS.EE. y surgen compañías dedicadas a producir tanto 
aplicaciones como herramientas. 

Los primeros desarrollos se centraron en EE.UU.A., en las universidades de Stanford, el Instituto de 
tecnología de Massachusetts (MIT). , la Universidad Camegie Mellon, y en el Instituto de 
investigación de Stanford ( SRI International). 

El anterior gráfico ilustra las el desarrollo histórico de los SS.EE. pioneros. De cada sistema se 
siguieron derivando otros. Aquí aparecen en rectángulos de esquinas redondeadas los lenguajes o 
herramientas de desarrollo (inglés: "experts System shells" ) que también fueron "extraidos" de los 
primeros SS.EE., o sea herramientas que tuvieron su origen en un S. E. particular, al cual se le 
privaba de la B.C. para obtener un módulo de propósito más general. 


1.4.1. EVOLUCION HACIA LOS SISTEMAS CON BASE DE CONOCIMIENTO 

El siguiente cuadro representa la evolución de los eventos asociados con el desarrollo del concepto de 
"Sistema Experto" y de los SS.EE. "pioneros". Después del cuadro se dan algunos datos adicionales 
sobre estos eventos. 


1940 1950 1960 1970 1980 1990 


Perceptron 

"CIBERNETICA" 

"INTELIGENCIA 

ARTIFICIAL" 

(Conferencia de Dartmouth) 

Logic Theorist 
Dendral 

General 

Problem 

Solver 

Strips 

"SISTEMAS 

EXPERTOS" 

resurgimiento 
de Redes Neuronales 

Herramientas comerciales 
para Sistemas Expertos 

1940 1950 1960 1970 1980 1990 
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El "Perceptrón" fué un modelo formal de nuerona, desarrollado por McCulloch y Pitts y presentado 
en 1943; en él se representa la actividad nerviosa como un fenómeno "todo o nada", que se puede 
calcular con una lógica de proposiciones. Se considera como el comienzo del desarrollo de las "Redes 
Neuronales Artificiales", disciplina que ha tenido un importante resurgimiento a fines del decenio 70 y 
comienzos del 80. Con Redes Neuronales Artificiales se puden implementar sistemas que funcionen 
análogamente a un S.E, como se verá en el capítulo 10. 

La Cibernética es una disciplina formulada en 1948 por el matemático Norbert Wiener, que estudia 
los fenómenos de comunicación y control, de manera general, aplicable a sistemas biológicos, 
organizacionales, sociales o a máquinas. Los principales conceptos que maneja son: Sistema, 
Información, Control, Retroalimentación y Estabilidad. 

El nombre de Inteligencia Artificial fué lanzado por John McCarthy (desarrollador del lenguaje 
LISP) en el encuentro "Summer Research Project" realizado en Dartmouth College (Hanover, New 
Hampshire, EE.UU.A.) en 1956. Este encuentro sirvió como catalizador para los investigadores que 
estaban interesados en las posibilidades de la "inteligencia" de la máquina. 

Por esta misma época, Newell, Simón y Shaw desarrollaron el "Logic Theorist" , sistema capaz de 
probar teoremas de lógica matemática tomados de la obra "Principia Mathemática" de Whitehead y 
Rusell. 

"Dendral", un sistema para determinar estructuras moleculares de compuestos orgánicos, fué el primer 
S.E., desarrollado por Lindsay, Buchanan, Feigenbaum y Lederberg , desde 1965 , en una época en 
que la mayoría de los investigadores no se había concentrado en la importancia del "conocimiento 
específico sobre un tema" para resolver un problema, sino que estaban centrados en los procesos de 
lógica y búsqueda, y en métodos de gran generalidad, pero de poca utilidad práctica, como el "General 
Problem Solver" (G. P. S.) 

El "G.P.S." (Emst y Newell, 1969) tenía como base la idea de un sólo esquema para muchas 
aplicaciones. Todo problema debia ser formulado como la búsqueda de unos "estados objetivo" (fines) 
en un "espacio de estados", con la posibilidad de aplicar "operadores" (medios) para pasar de un 
estado a otro. Este enfoque también se conoce como "análisis medios-fines" (inglés: "Means-Ends 
analysis"). 

El sistema "STRIPS" (Fikes y Nilsson, 1971) aplicaba la metodología del probador de teoremas a la 
solución de otros problemas. 

Como se ha visto antes, con el ejemplo del programa de diagnóstico médico usando una metodología 
tradicional, es conveniente separar los conocimientos del mecanismo de inferencia (M. I.) . 

Paralelamente, también se llega a la conclusión de que los "conocimientos específicos sobre una 
dominio" son de vital importancia para la solución eficiente de un problema, pues, por ejemplo los 
métodos generales, que se basan en el Análisis Medios-Fines, y trabajan sobre un Espacio de Estados, 
deben estimar la "distancia" entre dos estados, pero resulta que para aplicar este principio general, en 
la práctica hay que tener conocimiento del dominio del problema, pues una distancia entre estados que 
pueda parecer corta en la representación, realmente puede implicar costos altos en el mundo real. 
Ejemplo: si tenemos una pila de 4 bloques sobre una superficie, representados por la cadena ABCD, la 
destancia entre ese estado y el estado ABDC puede ser corta, pero en la práctica no lo es si estas 
representaciones corresponden a los bloques enumerados desde el superior al inferior: no podemos 
simplemente intercambiar las posiciones de los dos bloque inferiores: debemos conocer que existe la 
ley de gravedad. 

El éxito del DENDRAL y otros sistemas similares, hace que a finales de los años 70 se consolide 
como metodología y arquitectura definida , el concepto de "Sistema Experto". 
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Entre los SS.EE. inicialmente desarrollados, se destacan los siguientes, cuya implementación permitió 
comenzar a depurar la metodología y las herramientas para este tipo de sistemas: 

- DENDRAL Determinación de la estructura de moléculas de química orgánica, a partir de 

espectrografía de masas y otros datos. 

LIndsay, Buchanan, Feigenbaum, Lederberg ( Universidad de Stanford, 1965 ) 

- INTERNIST Para medicina interna 

Pople y otros ( 1975 ) 

- CASNET Ayuda para el diagnóstico y tratamiento de afecciones de glaucoma. Posee un modelo 

del desarrollo de la enfermedad. 

Weiss y otros ( 1976) 

- MYCIN Diagnóstico médico: Ayuda a determinar la identidad exacta de una infección de la 

sangre, y a prescribir los antibióticos apropiados. 

Edward H. Shortliffe y B. Buchanan (Universidad de Stanford, 1976) 

- PUFF Diagnóstico de infecciones pulmonares. 

Edward Feigenbaum ( 1977 ) 

- PROSPECTOR Prospección minera : establece hipótesis sobre la existencia de yacimientos 

minerales . 

Konolige ( SRI International, 1979 ) 

- MACSYMA Cálculo integral y diferencial. Desde 1965 se trabajó en antecesores de este S.E. como 

SAINT, SIN y MATHLAB. 

Martin y Fateman (Massachusetts Institute of Technology, 1976) 

- Rl, luego rebautizado XCON : Configuración de computadores Digital (Ej: VAX 11) cumpliendo 

con las necesidades del cliente y sometido a determinadas restricciones. 

John McDermott (Camegie Mellon University para Digital Equipment Corp., 1979) 


1.5. BENEFICIOS DE LOS SS.EE. Y MOTIVACIONES PARA SU USO 

El experto humano realiza actividades como las siguientes: 

1- Reconoce y formular el problema 

2- Resuelve el problema eficientemente 

3- Está en capacidad de explicar la solución 

4- Aprende de la experiencia 

5- Reestructura el conocimiento 

6- Estima cuando puede "romper las reglas" y lo hace 

7- Pondera la importancia relativa de los factores considerados 

8- Se "degrada grácilmente" = al salirse gradualmente de su dominio de conocimientos 

se va equivocando de manera gradual (grácil). 

Aunque un sistema que emule a un experto debería realizar todas estas tareas, en la actualidad un S.E. 
sólo realiza algunas de estas de manera satisfactoria. 
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Las motivaciones para desarrollar los SS. EE. y aplicarlos son principalmente : 

1- " El conocimiento tiene poder organizador" ( Edward Feigenbaum) 

2- Los expertos son escasos y costosos. 

3- Un S.E. permite mayor accesibilidad de la experiencia gracias a la posibilidad de duplicación y 

transferencia. 

Esto es importante, por ejemplo en una compañía con varias plantas dispersas y un solo experto. 
Otro caso es la posible transferencia de conocimientos y experiencia a zonas menos 
desarrolladas, que no cuentan con expertos locales. 

4- El S.E. puede ahorrar tiempo al experto, para que este se dedique a los casos más difíciles que 

exceden la capacidad del S.E. 

5- Los novatos se vuelven expertos de manera incremental. 

6- La formación de nuevos expertos es lenta. 

7- Muchos S.E. han exhibido una concordancia bastante aceptable entre sus conclusiones y las de un 

experto, en un alto porcentaje de los casos. 

8- Un S.E. tiene conoci mi entos utilizables de manera inmediata, descentralizada y duradera. 

9- El desarrollo de un S.E. es una oportunidad para recuperar, depurar, formalizar y conservar 

conocimientos y experiencia. 

10- El razonamiento de un S.E. es visible para los usuarios. 

11- Esa visibilidad hace que el S.E. sea utilizable para el entrenamiento de nuevo personal. 

12- El principio de separar los conocimientos y el método lógico de solución facilita el mantenimiento, 

comparado con la alternativa de implementar un programa tradicional que mezcla esas dos 
componentes. 

13- Un S.E. puede aumentar la productividad por varias razones: 

- Por ahorrar tiempo valioso del experto, como se explico en el punto 4. 

- Por ser más ágil que el humano, en especial cuando este debe consultar en grandes volúmenes 
de datos, que en el caso del S. E. podrían estar dentro del computador. 

- Por la accesibilidad y rapidez para atender, por ejemplo, diagnóstico de equipos, puede reducir 
pérdidas al reducir el tiempo fuera de servicio de un equipo. 

14- Un S.E. puede tener funcionamiento consistente, ya que no presenta dificultades típicamente 

humanas como estar cansado, aburrido, enfermo, o en huelga; o pasar por alto alguna 
i nf ormación. 


1.6. PROBLEMAS Y LIMITACIONES DE LOS SS.EE. 

1- Estrechez del dominio de aplicación 

2- Lenguajes limitados para expresar hechos y relaciones 

3- Superficialidad de los conocimientos 

4- Poco o nulo auto-conocimiento de su propio alcance y li mi taciones. 

5- Falla catastróficamente (no gradualmente) tan pronto nos apartamos de su campo de especialidad 

6- La justificación de sus conclusiones generalmente se reduce a la enumeración de las reglas usadas 
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7- Dificultades de "imagen " para su introducción en las organizaciones : 

7.1 - Extrañeza de los términos : "experto", "inteligencia artificial", etc. suenan a menudo 

demasiado pretensiosos y alejados de las preocupaciones cotidianas de una 
organización. 

7.2 - Falta de adopción dentro del departamento de procesamiento de datos tradicional. 

7.3 - Imagen " amenazante " : Si se percibe como sustituto de habilidades de los 

empleados, y no como una herramienta de apoyo y potenciación de esas 
habilidades. 

7.4 - Imagen de " Solución en busca de un problema " : Si se trata de introducir 

comenzando por preguntamos - En qué podríamos utilizar un Sistema Experto ? , 
en vez de comenzar por examinar los problemas que haya a la luz de todo el arsenal 
de técnicas que se tiene. 


1.7. IMPACTO DE LOS SS.EE. 

El hecho de que un S.E. tenga un desempeño de calidad uniforme, y que pueda ser igual o superior al 
de un experto humano en un alto porcentaje de los casos, al hacer juicios en un dominio limitado, 
puede tener grandes implicaciones sobre algunas profesiones u ocupaciones humanas, asi como sobre 
las organizaciones. 

Se está aplicando esta metodología en muy diversos campos, y a veces se trata de actividades de gran 
importancia estratégica y competitiva. Se estima que an algunos de estos casos las empresas no están 
interesadas en divulgar mucho sus técnicas o metodologías. 

La gran potencialidad de los S. E. se fundamenta básicamente en su capacidad para automatizar nuevas 
aplicaciones que hasta ahora no había sido factible automatizar, y para agilizar las tomas de decisión 
sin que se sacrifique por esto la buena calidad de dichas decisiones. 

El impacto de los S. E. en el mercado lo estima como significativo en gran cantidad de reportes como 
el libro Expert System Strategies de Paul Harmon, (1988): 

" Las grandes compañías en EE.UU.A. se han 
convencido de que la I.A., y en especial los 
Sistemas Expertos tienen potencial para mejorar 
significativamente la efectividad y la 
productividad. " 

" Entre 1985 y 1987, el 80% de las 500 compañías 
más grandes en EE.UU.A. han explorado el uso de 
Sistemas Expertos." 

" Durante los años 90, la mayoría de las compañías 
grandes y medianas encontrarán necesario usar 
Sistema Experto simplemente para permanecer 
competitivas." 


Los Sistemas con Base de Conocimientos o Sistemas Expertos, definitivamente "llegaron para 
quedarse", y su presencia se volverá tan normal como lo son actualmente las Bases de Datos. 
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2. CARACTERIZACION FUNCIONAL DE 
LOS SISTEMAS EXPERTOS 

2.1. CARACTERISTICAS OPERATIVAS DE UN S. E. 

1- Los conocimientos residen en la Base de Conocimientos (B.C.). 

2- El proceso de razonamiento lo implementa el M.ecanismo de Inferencia (MI.). 

3- Resuelve problemas de su dominio restringido tan bien, o mejor, que un experto. 

4- Razona utilizando reglas heurísticas que los expertos consideran eficaces. 

5- Manipula descripciones y relaciones cualitativas y razona sobre ellas. 

6- Funciona con datos inciertos y reglas imprecisas, usando algún método para determinar y 

manipular grados de credibilidad de datos y conclusiones. 

7- Contempla múltiples hipótesis alternativas al atacar un problema. 

8- Interroga al usuario en caso de requerir más datos o cuando encuentra conflictos en la 

información. En estos casos puede explicar con qué objetivo hizo la pregunta. 

9- Si el usuario lo solicita, puede mostrar la cadena de razonamiento que lo condujo a la 

conclusión a que llegó. 

10- Interactúa fácilmente con el usuario. 

11- Es flexible para permitir la modificación y adición de conocimientos. 


2.2. GRANDES ETAPAS DE UN SISTEMA EXPERTO 

- DESARRILLO: 

Incluye la construcción de la B.C. adquiriendo el conocimiento a partir de uno o más 
expertos, y de otras fuentes como documentos. Por lo general, en los sistemas prácticos se 
utiliza una "herramienta de desarrollo" (inglés "shell") que ya tiene las demás componentes, y 
por lo tanto el desarrollo se limita a la B .C. 

- UTILIZACION: 

Consiste, en general en una consulta. Una vez desarrollado, el S.E. se transfiere a los 
usuarios . Cuando estos desean recibir una recomendación, activan el S.E. el cual les solicita 
los hechos (datos) a cerca de la situación específica. El sistema decide que estrategias usar 
para aplicar las reglas de la B.C. El usuario debe poder solicitar al S.E. explicaciones a 
cerca del proceso de razonamiento que está aplicando. 

Fuera de este tipo de S. E., orientado a la consulta, también existen otros que realizan el 
monitoreo y control de un sistema en tiempo real y lego reportan a un operario , o 
ejecutan acciones autónomamente. 

- MANTENIMIENTO: 

Los S.E. deben actualizarse para mantener y mejorar su desempeño. Este mantenimiento se 
refiere generalmente a cambios en la B. C. 
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2.3. CRITERIOS DE APLICABILIDAD DE LA TECNOLOGIA DE SS.EE. 

Para que un problema sea, en principio, solucionable con el paradigma de Sistema Experto, se debe 
cumplir lo siguiente: 

1- Existe al menos un experto conocidos y dispuesto a colaborar en el desarrollo. 

2- La capacidad del experto se puede enseñar a otra persona, o sea que es transferible. 

3- En el dominio los expertos son significativamente mejores que los "amateurs" o novatos, por ser 

muy importantes los conocimientos aportados por la experiencia. 

4- Cada problema a resolver le toma al experto entre varios minutos y varias horas. 

De no ser así, es indicio de que el problema posiblemente es o muy trivial o demasiado difícil. 

5- Las técnicas de computación convencionales no son satisfactorias. 

6- La tarea es principalmente cognoscitiva, y se desarrolla sobre una especialidad o dominio bien 

delimitado, relativamente pequeño. 

7- La tarea no requiere habilidades físicas, sino razonamiento con conocimientos tanto formales como 

empíricos. 

8- Hay datos y casos de prueba disponibles. 

9- Los novatos se vuelven más eficaces y eficientes con la experiencia. 

10- Un S.E. aportaría beneficios identificables, por ejemplo : 

- Por ganacias en eficiencia 

- Por la conveniencia de recopilar los conocimientos de la especialidad 

- Por la posibilidad de distribución geográfica de copias del sistema 

11- La tarea no requiere "sentido común" (recuérdese lo visto en el apartado 1.3 ) 


3. ELEMENTOS DE UN SISTEMA EXPERTO 


3.1. ARQUITECTURA BASICA DE UN S.E. 

La característica primordial de un S.E. es su capacidad de razonar. Todo el conocimiento está 
almacenado en una Base de Conocimientos, y el computador está programado de manera que puede 
hacer inferencias a partir de ese conocimiento. El razonamiento lo desarrolla una componente 
denominada Mecanismo de Inferencia, el cual incluye procedimientos que manipulan datos 
simbólicos. 

Un S.E. tiene además otras componentes: 

- Memoria de trabajo 

- Interfaz con el usuario 

- Interfaz con el desarrollador 
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Adicionalmente, es deseable que el S.E. posea: 

- Subsistema Justificador (explica su línea de razonamiento). 

- Interfaz con otros sistemas (aplicaciones, bases de datos) 

- Subsistema de aprendizaje automático. 


3.1.2. BASE DE CONOCIMIENTOS 

La información en la B.C es todo lo necesario para comprender, formular y resolver el problema. 
Incluye dos elementos básicos: 

- HECHOS : situación del problema y teoría del dominio de aplicación. Comprende la representación 

de la existencia de entidades y relaciones entre estas. 

Ejemplo : Nivel de inversión = alto 

Posición social = buena 

Marco jurídico = estable 
Proteccionismo = creciente 

Red comercial = adecuada 

- REGLAS, en gran parte heurísticas, que dirigen la utilización del conocimiento para resolver 

problemas. Las reglas heurísticas (o simplemente heurísticas ) son conocimientos empríricos. 
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Ejemplos: 

Reglal (Regla del tipo "situación-acción"): 

Si 

La lámpara roja a la izquierda del tablero está encendida, 

y 

La temperatura del agua pasa de 90 grados, 

entonces 

compruebe el nivel del aceite. 


Regla2 (Regla de tipo deductivo): 


Si 

la administración de la empresa está poco motivada, 

y 

la imagen social es probre, 


y 


la tasa de sindicalización es pobre, 

entonces 

la motivación del personal es pobre. 


3.1.3. MECANISMO DE INFERENCIA 

El "cerebro" del S.E. es el M. I. , También conocido como: "motor de inferencia", "estructura de 
control" o "interpretador de reglas". Es escencialmente un programa que proporciona una 
metodología para razonar con la información en la B.C. y la Memoria de Trabajo, hasta llegar a 
conclusiones. 

Existen diferentes esquemas para organizar los pasos de razonamaiento al buscar la solución a un 
problema: 

- En el esquema "hacia atrás" se razona desde un objetivo o hipótesis hacia los datos. Este "modus 
ponens" es una estrategia muy utilizada en sistemas para diagnóstico. 

- En el esquema de razonamiento "hacia adelante" , los pasos de inferencia se aplican a partir de los 
datos hacia un objetivo, como ocurre, por ejemplo en el sistema Rl/XCON (mencionado en 1.4.2) . 

- En un esquema de razonamiento "oportunístico" se aplican piezas del conocimiento, bien sea 
"hacia atrás " o "hacia adelante" en el momento más oportuno. Este se utiliza mejor en los sistemas 
con tablero . 

El proceso de inferencia se puede visualizar representándolo en árboles en los cuales los nodos 
representan hechos, y en los cuales conjunción "Y" se representa por medio de un arco circular entre 
las premisas : 

Por ejemplo, las dos reglas : 1 - Si A y B entonces C 

2 - Si C o D entonces E 
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sinembargo, cuando la cantidad de reglas aumenta esta representación deja de ser práctica . 


3.1.4. MEMORIA DE TRABAJO 

Es un área de memoria (inglés: " workspace ") reservada para la descripción del problema actual, tal 
como lo especifican los datos de entrada; también se usa para registrar resultados intermedios. 
Conserva hipótesis y decisiones intermedias de tres tipos: 

- PLAN: Cómo atacar el problema. 

- AGENDA: Acciones potenciales que esperan ejecución. 

- SOLUCION: Hipótesis candidatas y cursos de acción alternativos que el sistema ha generado hasta 

el momento. 

La memoria de trabajo también se llama "Tablero", "Pizarra" o "Pizarrón" ( inglés: "Blackboard" ), 
pero se utiliza este término, especialmente cuando el sistema completo se compone de varios módulos, 
siendo cada uno un S.E. especialista en determinado nivel de detalle o de descripción del problema 
( sección 5.5.4 ) . En estos casos se habla de "Arquitecturas con Tablero", y cada S.E. especialista se 
denomina "Fuente de Conocimiento" (inglés: "Knowledge Source"). 


3.1.5. INTERFACES 

Un S.E. puede tener interfaces de varios tipos: 
- Interfaz con el desarrollador 


El S.E. debe poseer una manera de interactuar con el usuario que a este le resulte cómoda, 
y que en su lenguaje y gráficos sea apropiada al dominio del problema sobre el que verse 
el sistema experto 

- Interfaz con el usuario 


- Interfaz con otros sistemas : (Bases de Datos, aplicaciones, hardware ( ej: sensores, etc.) ) 
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Idealmente un S. E. debe tener un subsistema que pueda explicar al menos el primero de los siguientes 
interrogantes : 


1- Cómo llegó a determinada conclusión ? . 

2- Para qué solicita determinada información ? . 

3- Porqué no llegó a otra determinada conclusión ? . 

4- Qué falta determinar antes de poder llegar a una conclusión ? . 

En la práctica esto se logra en mayor o menor grado, siendo la más importante la primera de ellas. 

La capacidad de hacer un seguimiento de la causas (hechos y reglas) responsables de una conclusión, 
es crucial, tanto durante la transferencia de conocimientos, como durante la solución de los problemas 

Esta capacidad del sistema es primordial para que este sea confiable desde el punto de vista del 
experto, del usuario y del ingeniero del conocimiento . 


3.1.7. SUBSISTEMA DE APRENDIZAJE 

Los expertos pueden analizar su propio desempeño, aprender más con las nuevas experiencias, y 
aumentar su eficacia para los futuros problemas. Similarmente, tal evaluación y perfeccionamiento es 
deseable en los SS.EE. de manera que el programa sea capaz de analizar las razones de sus éxitos y 
fracasos para perfeccionar la B.C. y ser más eficaz y efectico en el futuro. En la actualidad, esta 
componente, es escasa en los sistemas comerciales, pero es un interesante campo de investigación en 
sistemas experimentales. 

Entre las herramientas para desarrollo de S.E. que tienen capacidad de inducir reglas, a partir de casos 
de ejemplo, podemos mencionar : Expert Ease, IstClass, RuleMaster y TIMM . 


4. CICLO DE VIDA DE UN SISTEMA 
EXPERTO 


1- Análisis de la factibilidad de la aplicación. 

Análisis del DOMINIO y de la TAREA, teniendo como guía, tanto los criterios de 
aplicabilidad vistos en la sección 2.3, como las tipos de aplicación (vistos en 1.2) que 
históricamente han resultado adecuadas para el paradigma de S.E. Se debe dar una 
primera respuesta, así sea aproximada, a las siguientes preguntas: 

- Es realizable el sistema ? 

- En qué medida mejorará la situación existente ?. 

- Quienes serán los encargados de realizarlo ?. 

- Que presupuesto estimado se necesita ?. 



Curso Básico de Sistemas Expertos 


16 


- Qué tiempo tardará en finalizar ?. 

- Qué medios se utilizarán ? . 


2- Formulación de requisitos 

3- Diseño conceptual. 

Definir la estmctura del sistema y la manera como realizará la tarea. 

4- Escogencia de las fuentes de conocimiento: experto, documentos, etc. 

5- Conformación del equipo humano de desarrollo. 

Fuera del experto, estará(n) el (los) "ingenieros" del conocimiento, como actor(es) 
centrales . Pero, aparte del I.C. y el experto, se debe tener en cuenta que otras personas 
de la organización deben colaborar para la dedicación de recursos, la implantación exitosa 
y aceptación del S.E.: 

- La administración. 

- Los usuarios finales. 

- El "padrino", o "protector" (algún superior que apoye el desarrollo y pueda mediar 

ante la alta dirección para agilizar tramites, por ejemplo) 

- Los aprendices de "ingeniería del conocimiento" (personas que durante el proceso de 

desarrollo de un S.E. lo están siguiendo, para capacitarse en la metodología. 

(En el numeral 8.1 se tratarán estos roles en mayor detalle) 


6- Selección de herramienta de desarrollo y equipo de cómputo. 

7- Adquisición y Representación del conocimiento. 

Obtener el conocimiento y formalizarlo., Expresándolo en las estructuras y el lenguaje 
soportados por la herramienta de desarrollo. Esta es la etapa central del desarrollo del 
S.E. y presenta dificultades especiales. 

8- Verificación del prototipo : 

Asegurarse de que la B.C. es completa, consistente y correcta en cuanto a SINTAXIS. 

9- Validación del prototipo : 

Asegurarse de que el sistema hace lo que se supone que debe hacer, cumpliendo 
las especificaciones, o sea de que su SEMANTICA es correcta. 

10- Corridas de casos de prueba: 

Asegurarse de que el funcionamiento entrada-salida emula bien al experto. Uso 
en paralelo con el "sistema" existente (experto) 

11- Entrega a los usuarios . 

12- Utilización o explotación. 

13- Mantenimiento, actualizaciones. 

- Adaptación de interfaces de usuario. 

- Adaptación del sistema a otros ambientes de hardware y software. 
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- Adapatar el sistema a nuevos requisitos de los usuarios. 

- Correción de errores descubiertos durante la operación. 

- Mejoras al desempeño. 

- Actualizaciones a la B. C., por ejemplo : 


- Adición de nuevas reglas, incluyendo algunas para cubrir casos únicos 

y excepciones . 

- Modificaciones a las reglas, para reflejar cambios en las condiciones 

del dominio, o para corregir o mejorar las reglas. 

- Supresión de reglas que se han demostrado irrelevantes. 

El siguiente gráfico muestra, por ejemplo, como varió la cantidad de reglas 
que tenía el sistema R1 / XCON , durante los primeros años de su 
funcionamiento. No obstante la tendencia general al incremento en el número 
de reglas y en los modelos de computador que el sistema puede configurar, se 
presento disminución del número de reglas en cierto período. 



Obviamente, el ciclo de vida real de un sistema no es tan "lineal" como lo hace aparecer este listado 
"oficial", tanto durante las pruebas, como durante el mantenimiento, a menudo hay que regresar a 
etapas anteriores de especificaciones, diseño e implementación, para replantear o rediseñar el sistema. 

Además, LA DOCUMENTACION correspondiente debe desarrollarse en paralelo con el S.E. 

Cuando se estudie , en el capítulo 8 el proceso de desarrollo, se profundizará en las etapas principales 
de este "ciclo de vida". 
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5. EL CONOCIMIENTO Y SU 

REPRESENTACION 

5.1. EL CONOCIMIENTO Y SU RELACION CON LOS DATOS 

La definición de "conocimiento" no es única para diversos investigadores, y también su relación con 
los "datos" no está muy bien definida. Para nuestros fines podemos tomar: 

" Conocimiento es información acerca del mundo que le permite al experto juzgar y tomar decisiones". 

Las capacidades que originan el alto nivel de desempeño de un experto, incluyen : conocimiento 
extenso sobre el dominio, reglas heurísticas que simplifican y mejoran los métodos para atacar un 
problema, metaconocimiento ( sección 5.4 ), y formas compiladas de comportamiento que aportan 
gran economía de esfuerzo. 

Sin embargo, hay que tener en cuenta que el conocimiento es a menudo inexacto, incompleto y mal 
especificado. 

El siguiente diagrama, propuesto por R.G. Bowerman y D.E. Glover, trata de clasificar los sistemas 
computacionales, según el nivel de abstracción 



El siguiente diagrama, propuesto por Gio Wiederhol, muestra las funciones complementarias del 
conocimiento y los datos: 



Curso Básico de Sistemas Expertos 


19 



BASES DE CONOCIMIENTO vs BASES DE DATOS 

Los datos reflejan el estado actual de mundo, al nivel de ejemplares, e incluye muchos detalles de 
"bajo nivel". El conocimiento puede ser complejo, pero trabaja con generalizaciones, se refiere a tipos 
de entidades más que a ejemplares individuales. 

La complejidad de la clase de cosas que se desea registrar en una B.C. es típicamente mayor que la que 
se almacena en una B.D.: 

- En una B.C. hay que manejar información incompleta, en una B.D. se pretende que existan 

todos los campos. 

- Las B.C. deben expresar relaciones entre clases genéricas. 

- Las B.D. no trabajan con lo que significan o implican sus datos. Las B.C. deben trabajar 

también respecto a las consecuencias lógicas. 

- Muchos S.E. poseen más relaciones que ejemplares ; en las B.D. ocurre lo contrario. 

Algunas de estas diferencias no son absolutas sino de grado, pero de todas maneras, las 
preocupaciones centrales de un DBMS han sido: volumen de datos, organización, seguridad, 
compartición y distribución, y al Sistema Administrador de la Base de Conocimientos ( inglés: 
"Knowledge-Base Management System: KBMS ") le interesan la interpretación y la inferencia. 


Hallar lo implicado por un hecho, en general no es un problema trivial, por ejemplo, si respecto a una 
pila de bloques de colores, sábenos que : 

- Hay un bloque azul encima de otro bloque que está sobre un bloque verde. 
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no es obvio que el siguiente hecho sea implicado por el anterior: 

- Hay un bloque azul sobre uno que no es azul 

( Solución : para resolver esto podemos considerar las posibilidades: AZUL o NO AZUL que tiene 
el bloque intermedio entre el que sabemos que es azul y el que sabemos que es verde). 


5.2 COMPONENTES DEL CONOCIMIENTO: 

- DENOMINACION: Capacidad de referenciar, simbólicamente un objeto. 

- DESCRIPCION : Capacidad de describir las propiedades principales que caracterizan el objeto. 

- ORGANIZACION : Capacidad de organizar los objetos en categorías conceptuales o clases, por 

ejemplo en jerarquías. 

- RESTRICCIONES: Capacidad de conocer los l ími tes en los rangos de valores, relaciones y 

estructuras organizacionales de los objetos. Estas restricciones pueden ser 
absolutas, o depender de los valores de otros atributos. 

- OTRAS RELACIONES: Capacidad de conocer las relaciones del objeto con otros. 


DENOMINACION: 

Para representar el conocimiento, debemos se capaces de referimos a los objetos por un nombre o 
identificación simbólica. Por ejemplo: "Coltejer", "petróleo", etc. Los nombres que asignamos deben 
ser univocos, de manera que sepamos exactamente a cual objeto nos estamos refiriendo. Si más de 
una persona se llama "Juan Pérez" , entonces requerimos una identificación adicional para determinar a 
un Juan Pérez particular, por ejemplo: 

- Añadiendo más detalles al nombre: "Juan C. Pérez" 

- Asociando un códifgo único, por ejemplo la cédula. 

- Asociando otras propiedades: "el Juan Pérez que vive en ." 

El nombre de un objeto es un s ím bolo que puede "remplazar" al objeto real. Aunque para nosotros es 
una operación trivial, es un paso básico en el conocimiento y en poder razonar sobre los objetos. 
Según experimentos del desarrollo de los niños, antes de abstraer el nombre como representante 
suficiente de un objeto, comprendendemos los objetos asociados a sus propiedades funcionales. De 
esto se saca una lección útil: Se recomienda comprender el concepto y su funcionalidad a un nivel 
superior antes de tratar de bautizarlo a un nivel inferior. 
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La descripción de un objeto se puede hacer por medio de su relación con otros objetos, y/o de la 
relación entre sus componentes. Obviamente, para casi todos los objetos hay una gran cantidad de 
propiedades que podrían describirlos. Un objeto complejo, como una persona, tendrá una gran 
cantidad de propiedades, como características físicas, edad, experiencia, ocupación, etc... 

Por ejemplo: 

- Juan: tiene 25 años de edad, tiene una estatura de 1.70 m., ha sufrido de 
alergias, tiene fiebre y ha desempeñado diferentes trabajos. 

Las propiedades que describen el objeto dependen de la aplicación que daremos al sistema: Un 
sistema para diagnóstico médico se enfocará mucho en propiedades físicas, mientras que un sistema 
para selección de personal se enfocará más en la capacitación, calificaciones, experiencia e historia de 
empleo. 

Parte de la habilidad del I.C. para describir un objeto para un S.E. consiste en decidir correctamente 
qué debe conocer el sistema acerca del objeto para poder realizar su razonamiento. 


ORGANIZACION: 

Debemos conocer la clasificación u organización de los objetos en clases o categorías conceptuales. 
Una manera posible es describir algunos objetos como subclases de una clase más general; por 
ejemplo, un "automóvil" es un tipo de "vehículo". 

A menudo se usa la analogía de "padre-hijo" para capturar las característica escencial de esas jerarquías 
conceptuales, así: "vehículo" es es el concepto padre de "automóvil", el cual a su vez es el concepto 
padre de "Ford 87". 

El beneficio más importante de organizar los objetos en categorías es que esto hace posible "saber 
donde mirar" y hace eficiente las búsquedas. 


RESTRICCIONES: 

Las restricciones se pueden utilizar para: 

- Determinar la posible invalidez de un conocimiento ( si está fuera de rango). 

- I nf erir información que no está disponible directamente. 

- Regularizar el acceso a la información. 

Durante el razonamiento, las restricciones sirven para enfocar el proceso, restringiendo los atributos 
que se deben enfocar en determinado momento. 


OTRAS RELACIONES: 

Tanto la DESCRIPCION, como la ORGANIZACION y las RESTRICCIONES se basan en las 
relaciones fundamentales que tiene un objeto; pero además de esas, debemos escoger las otras 
relaciones entre objetos a representar dentro del sistema. El número de entidades involucradas en el 
sistema, depende del nivel de análisis y de la profundidad del conocimiento utilizado. 

En general, las relaciones representan un área donde la RESPRESENTACION DEL 
CONOCIMIENTO se funde con la INFERENCIA : algunas relaciones, como por ejemplo los 
parentescos familiares se expresan de manera natural como organización del conocimiento, pero otras 
se expresan mejor como procedimientos que involucran inferencia. 
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A veces hay confusión entre las propiedades de un objeto y sus relaciones con otros, por ejemplo: el 
hecho de que Juan es un "jefe", puede considerarse como una propiedad de Juan, o como una relación 
entre Juan y cada uno de sus subordinados. 

Las relaciones actúan como enlaces entre objetos, por ejemplo: 

- Las relaciones de parentesco : abuelo, padre, etc... 

- Relaciones entre: tasas de interés, inflación, y precio de inmuebles. 

- Relación entre una sustancia y su contenedor, que puede originar peligro. 


5.3. CLASIFICACIONES DE CONOCIMIENTO 

Según su disponibilidad pública, los conocimientos se pueden clasificar en: 

1 - Conocimiento Público o Documentado: 

Conocimientos que están formulados explicitamente en algún medio 
(libros, revistas , manuales, bases de datos, etc.) o que se pueden 
aprender recibiendo alguna instrucción . Este constituye una especie de 
"Conocimiento Público", porque, al menos en principio, está disponible 
para quien lo desee. 

2 - Conocimiento íhivado: 

Aquel que no está explícitamente formulado en ningún medio accesible, 
ni está normalmente disponible a partir de instrucción. Este 
conocimiento lo adquiere un experto, precisamente através de su 
experiencia personal. Son conoci mi entos empíricos. Este tipo de 
conocimiento es el más valioso que debe tener un S .E., porque es el que 
lo asemeja en algo al verdadero "experto" humano. ( Es el 
conocimiento que se denomina en inglés "Expertise", que se adquiere 
através de la experiencia "experience"). 


Según su relación con la acción, el conocimiento también se puede clasificar en: 

1- Declarativo o factual. 

2- Procedimental. 

Según la profundidad de comprensión que se tenga de los fenómenos y sus relaciones causales, el 
conocimiento se puede clasificar en: 

1- Conocimiento superficial. 

2- Conocimiento profundo. 

Los conocimientos representados en el S.E., según lo estén en la Base de Hechos, o en la Base de 
Reglas, o en el controlador de la estrategia se clasifican en : 

1- Conocimiento asertivo (el de la Base de Hechos, ej: impuesto A = 30 % ) 

2- Conocimiento operativo (el de la Base de Reglas ) 

3- Metaconocimiento (el de la estrategia de control o metarreglas ) 

Los conocimientos dados por el estudio y la experiencia sobre determinado dominio, incluyen : 
Hechos , Teorías , Reglas que operan en el dominio , Estrategias y reglas heurísticas sobre que hacer 
en cada situacón del problema 
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5.4. METACONOCIMIENTO 
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El Metaconocimiento consiste en el conocimiento de estrategias sobre como utilizar el conocimiento 
sobre un dominio de aplicación. En el caso en que este metaconocimiento esté representado por medio 
de unas reglas, estas se denominan meta-reglas : Son reglas a cerca de las reglas. 

En un S.E., el metaconocimiento puede guiar al sistema para priorizar y seleccionar las reglas a 
aplicar, resolver conflictos en caso de aplicabilidad de varias reglas, y ayudar a detectar errores durante 
la introducción de nuevos conocimientos. 


5.5. TECNICAS DE REPRESENTACION DE CONOCIMIENTOS 

Para que un sistema de software utilice conocimientos relativos a un dominio, debe contar con una 
forma de representar dichos conocimientos. Existen tres cualidades importantes respecto a un lenguaje 
o estructura para representación de conocimientos en el caso de los SS.EE.: 

- EXPRESIVIDAD : Puede expresar de manera efectiva el conocimiento del experto ? 

- COMPRENSIBILIDAD : Puede el experto conocer que s"sabe" el sistema ? 

- ACCESIBILIDAD : Puede el sistema utilizar y aprovechar bien la información que le ha sido 

dada ? 

La experiencia hasta el momento ha demostrado que ninguno de los lenguajes de representación de 
conocimientos todos esas cualidades en alto grado . Los primeros intentos para construir sistemas 
inteligentes utilizaron el cáculo de predicados de primer orden como lenguaje de representación. El 
cálculo de predicados era atractivo por su poder expresivo de carater general y su semántica bien 
definida . Sinembargo, dada granularidad de sus estructuras, y el hecho de carecer de facilidades para 
construir estructuras más complejas, se dificulta la utilización en ciertos dominios, así como la 
comprensión del conocimiento expresado en él . Esas fificultades motivaron el desarrollo de "Redes 
Semánticas" , y posteriormente de representaciones orientadas a "objetos" , como los MARCOS 
(inglés: "Frames") . 


5.5.1. REDES SEMANTICAS 

Las redes son una estructura natural y eficiente para representar ciertos conoci mi entos. Están 
compuestas por nodos y enlaces o arcos. Los nodos representan hechos, objetos físicos o intangibles, 
o situaciones; mientras los enlaces definen las relaciones entre los hechos. 

Aunque estas redes tienen muchos precursores dentro de la investigación en I.A. , el primero que las 
propuso como estructuras con un tratamiento formal fué M. Qillian en 1968. Las redes semánticas 
han sido muy utilizadas en en I. A., en especial en trabajos que tienen que ver con la comprensión de 
lenguajes naturales, donde estas se crean como estructuras pre-existentes en el sistema, contra las 
cuales se pueden comparar entradas de texto, y a las cuales se puede agregar nuevo conocimiento. 

Un ejemplo fundamental de red semántica es aquel en el cual se representa la pertenencia de un objeto 
a una o más clases por medio del enlace ES UN(A) , y las componentes o propiedades del objeto por 
medio del enlace TIENE , o en sentido inverso: ES PARTE DE, por ejemplo : 
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Las redes semánticas resultan muy naturales para representar pues taxonomías (clasificaciones) , 
composición de un objeto, y relaciones causales ( = causa - efecto) entre objetos . 



Las redes semánticas se han utilizado en sistemas expertos como PROSPECTOR e INTERNIST, 
aunque al parecer ha disminuido su utilización. 


ERAGMENTO DE UNA TAXONOMIA UTILIZADA EN PROSPECTOR 
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Cuando un sistema trabaja con redes semánticas, el proceso de responder preguntas se basa en la 
comparación o aparejamiento de patrones ( inglés: "pattem matching" ) . en este caso el patrón a 
comparar será una subred, por ejemplo : 



el sistema compara esto con la red existente, para hallar, por ejemplo en este caso, todos los elementos 
que tienen la relación B con el objeto A . 

Fuera de este aparejamiento , realmente el significado de una red semántica, se establece con los 
procedimientos que "interpretan" a los enlaces. Cada tipo de enlace tiene propiedades diferentes, ( por 
ejemplo: algunos son "transitivos", como "ES UN', otros no lo son ) y requiere una interpretación 
diferente. 

En cuanto a la representación interna, se la red semántica se implementan en lenguajes que admitan 
apuntadores (pointers), una manera de representación es hacer corresponder a cada nodo de la red un 
registro (inglés"record") o estructura, y a cada relación un apuntador. Los varios tipos de relación que 
puede tener un nodo se pueden representar por medio de una lista de celdas enlazadas ( "linked list") a 
la manera de las listas del lenguaje LISP. 

Aunque la herramienta de desarrollo que utilicemos no trabaje con redes semánticas, de todas maneras 
este modelo muchas veces es útil para comenzar a analizar el problema y aclarar conceptos y relaciones 
dentro del dominio que nos interese. Su aplicación principal es para representar las taxonomías y 
estructura de los objetos. 


5.5.2. MARCOS 

Un Marco (inglés: "frame" ) proporciona una representación estructurada de un objeto o clase de 
objetos, por ejemplo, un marco puede representar un "automóvil", y otro una "clase" de automóviles . 

El marco es una estructura de datos , propuesta por Marvin Minsky en 1974, que contiene toda la 
información que nos interesa acerca de un objeto, organizada de manera predefinida. El marco se 
compone de campos (inglés: "slots") . Por lo general cada campo corresponde a un atributo y tienen 
valores correspondientes a ese atributo, pero algunos campos pueden contener: valores por defecto, 
información sobre como utilizar el marco, o información sobre que hacer si ocurre determinada 
situación. 


Ejemplo de un marco : 
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NOMBRE: Avión 

TIPO: rango (combate, transporte, entrenamiento, 

bombardero, ligero, espía, carga) 
FABRICANTE: rango (McDonnell-Douglas, Boeing,... ) 

PESO VACIO: rango ( 227 Kg a 113400 Kg) 

PESO LLENO: rango ( 340 Kg a 226800 Kg) 

si_necesario (1.6 x PESO VACIO) 

RANGO DE CRUCERO : si_necesario (ver tabla de RANGO DE CRUCERO 

según TIPO y PESO LLENO) 

TRIPULACION :rango ( 1 a 3 ) 
por_defecto 2 


Los marcos proporcionan un método para combinar declaraciones y procedimientos dentro de un 
único ambiente de representación del conocimiento. El principio básico de los marcos es el 
empaquetamiento tanto de datos como procedimientos en estructuras de conocimiento. 

En un lenguaje o herramienta que proporcione marcos, hay manera de organizar conjuntos de marcos 
en taxonomías. Esto permite al diseñador de la B.C. describir cada clase como una especialización 
(subclase) de otras clases más genéricas. Entonces, por ejemplo la clase automóvil se puede 
describir como la clase vehículo más un conjunto de propiedades que los distingue de otras clases de 
vehículos. O sea que los marcos se pueden organizar en jerarquías y redes con la facultad de 
"heredar" información, para extraer propiedades que un concepto de nivel i nf erior comparte con una 
clase (superior) de conceptos. 

Además, los marcos se pueden enlazar con reglas, haciendo posible que se activen predicados cuando 
se almacena o se recupera información. 

Haciéndo referencia a los componentes del conocimiento vistos en la sección 5.2 (DENOMINACION, 
DESCRIPCION , ORGANIZACION, RESTRICCIONES , OTRAS RELACIONES ) , en un marco 
tenemos : 

Denominación : Se asigna un nombre único a cada marco. 

Descripción: El cuerpo del marco se compone de campos que normalmente conservan 

valores de atributos que describen el objeto representado por el marco. 

Organización: Cada marco normalmente tiene enlaces desde otros que representan conceptos 

más generales, o hacia otros que representan conceptos más particulares. 

Restricciones: Algunos campos del marco pueden establecer restricciones en los valores que 
puede tomar un atributo. Además algunos campos pueden tener 
PROCEDIMIENTOS LIGADOS (inglés : "Attached Procedures" (como por 
ejemplo : "si_necesario ") 

Otras Relaciones: El valor de un campo puede ser otro marco. Adicionalmente los marcos se 

pueden relacionar por medio de reglas 

Para almacenar información en un marco ya definido, usamos algún tipo de asignación, y para 
recuperar información, los enlaces entre los marcos permiten buscarla através de marcos intermedios, 
por ejemplo, sean los marcos: 

MARCO : Juan Pérez MARCO : María Rodríguez 

PADRE : Estudiante PADRE : Profesor 






27 


Curso Básico de Sistemas Expertos 

PROFESOR: María Rodríguez 

Matemáticas 

TELEFONO : 1234567 


DEPARTAMENTO: 

OFICINA: 321 E 
TELEFONO : 8901234 


Podremos : - asignar : (teléfono de Juan Pérez ) := 1235567 

-verificar (if): (teléfono de María Rodríguez) = 8901234 

lo cual dará "VERDADERO" 


8901234 


- recuperar: 

o también: 


(teléfono de Juan Pérez) lo cual dará 1235567 

(teléfono de (profesor de Juan Pérez)) lo cual dará 


EJEMPLO DE HERENCIA DE ATRIBUTOS EN UNA JERARQUIA DE MARCOS 


NOMBRE 

REUNION 

TIEMPO 

1 

LUGAR 

1 

TOPICO 

1 

ASISTENTES 

1 

.... 

1 


NOMBRE 

REUNION DE MERCADEO 

TIEMPO 

1 

LUGAR 

1 

TOPICO 

MERCADEO 1 

ASISTENTES 

1 

.... 

1 



NOMBRE 

REUNION 38 


TIEMPO 

1992/08/20 3 p.m.-4 p.m. 

i 

LUGAR 

BLOQUE 5 , SALON 5-3 

1 

TOPICO 


1 

ASISTENTES 

MARIA, JUAN, PEDRO 

1 

.... 


1 


OMWKMWKMWKWWHWWHWOWWQMWHWWHWOWOWOWOWOWMOa 


Usualmente un marco tiene los siguientes campos (en inlés se usa la palabra para ranuras: "slots" 
): 


- Nombre del marco 

- Referencia al los marcos padres 

- Atributos 

- Procedimientos ligados 
Cada campo tiene, en general: 

- Nombre del campo: Este debe ser único dentro del marco, pero dos marcos 

distintos pueden tener un mismo nombre. 
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- Valor del campo: Este puede estar en blanco cuando se crea el marco, y ser 

llenado después. Esto equivale a saber que el objeto debe 
tener una propiedad determinada, según el tipo de objeto que 
es, aunque no sepamos su valor. Por ejemplo, en un marco 
que represente a una persona puede haber un campo EDAD, 
porque la persona debe tener una edad, así en un momento 
dado sea desconocida. 

- Procedimiento o predicados ligados : Si_necesario , Si_agregado , Si_removido 


Refiriéndonos al ejemplo ilustrado en la gráfica anterior, la 
siguiente gráfica adiciona algunos predicados ligados para 
dar una idea de cómo las acciones de agregar y remover 
datos pueden activar procedimientos ligados que se encar gen 
de actualizar la información en otros marcos, en este caso 
los narcos que representan a los asistentes. En este ejemplo 
asumimos que la referencia a un Campo determinado de un 
marco se hace con la sintaxis: campo(marco). 


Estos procedimientos asociados son opcionales, y dan gran 
flexibilidad a los marcos : 


- si_necesario : Procedimiento que se ejecuta si se requiere 
averiguar el valor del atributo. Por 
ejemplo, en un marco que representa un 
apersona, y que posea un campo: 
FECHA DE NACIMIENTO, en el campo 
EDAD del mismo marco, puede haber un 
procedimiento que calcule la edad restando 
el valor de FECHA DE NACI MI ENTO 
de la fecha actual dada por el reloj del 
sistema. 


- si_agregado: Procedimiento que se ejecuta al tratar de 

asignar o modificar el valor del campo. 
Este procedimiento puede servir, por 
ejemplo, para validar un valor antes de 
aceptarlo para el atributo en cuestión. 

- si_removido: Procedimiento que se ejecuta si el valor 

del campo se quita. 


Las ventajas de los lenguajes de marcos son considerables: 

- Se aproximan bien a la manera como los expertos piensan acerca de mucha parte de su conocimiento. 

- Proporcionan un representación estructural concisa de relaciones útiles. 

- Soportan una técnica de "definición por especialización" que es fácil de usar para los expertos. 

- Se han desarrollado algoritmos de deducción de proposito especial que aprovechan las características 

estructurales de los marcos para ejecutar rápidamente una serie de inferencias que son 
de frecuente ocurrencia en SS.EE. 

Las herra mi entas más avanzadas para S.E. soportan marcos y reglas de manera integrada. Estas 
herramientas ponen a disposición de los expertos que no son programadores la potencia organizacional 
y expresiva de la programación orientada a objetos. Tales herra mi entas hacen posible la creación de 
modelos que incluyen descripciones estructurales del dominio y especificaciones del comportamiento 
de los objetos y del comportamiento de los expertos que trabajan con esos objetos. 
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PREDICADOS LIGADOS 


VALOR 

SI - NECESARIO 

SI _ AGREGADO 

SI - REMOVIDO 

NOMBRE 

REUNION 38 




TIEMPO 

1 882/08/20 3 p.m-4 p.m. 




LUGAR 

BLOQUE 5 , SALON 5-3 


? 


TOPICO 



/ 


ASISTENTES 

MARIA JUAN. PEDRO 


f 


.... 


/ 

1 

\ 


NOMBRE 

MARIA 

.... 




AGENDA 







NOMBRE 

JUAN 

.... 




AGENDA 







r PROC agregue_asist(reun,persona) A 


fi je(reun,agerida(persona)) 


END 


PROC agregue_lugar(reun,lugar) 

IF disponible(lugar,tiempo(reun)) 

THEN reserve(lugar,tiempo(reun)) 

ELSE notifique(asist(reun),"Hay conflicto")) 

END 


\/ 


PROC remueva_asist(reun,persona) 
cancel e(reun,cal endar(persona)) 

END 

v_y 


Los marcos son una manera muy flexible y poderosa de representación de conocimientos, y son 
utilizados en varias herramientas comerciales (ing.: "expert System shells"),como: KRL, KL-ONE, 
ACORN, ESP Frame Engine, KnowledgeCraft, KEE y S .1 , entreoirás. 


5.5.3. REGLAS 

Las reglas son asociaciones entre una CONDICION o PREMISA y una CONCLUSION . La 
condición a su vez puede ser un solo hecho o una conjunción (y) y/o disyunción (o) de hechos . 
Generalmente la conclusión es un sola hecho . Las reglas también son llamadas REGLAS DE 
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PRODUCCION , y los sistemas que se basan en ellas se denominan SISTEMAS DE PRODUCCION 
(inglés: " Production Systems ") . 

Aunque los Sistemas de Producción están incorporados en los formalismos de la lógica matemática y 
las ciencias computacionales, se puede considerar que fué Alien Newell quien en 1967 los propuso 
como una manera de formular las teorías del proceso de información que efectúan los humanos para la 
solución de problemas. En 1972 Newell describió un interpretador de sistemas de producción de 
propósito general : "Production System Interpreter" , del cual se derivan, entre otros, la serie de 
lenguajes OPS , muy utilizados para implementar Sistemas Expertos. La gráfica siguiente muestra el 
del desarrollo histórico respectivo . 



Los sistemas basados en reglas son actualmente los más populares para codificar los conocimientos de 
solución de problemas que poseen los expertos . Los expertos tienden a expresar la mayoría de sus 
técnicas de solución de problemas en términos de un conjunto de reglas "situación - acción " , y esta 
es una de las razones para que se adopte tan frecuentemente este tipo de representación en SS.EE. 

Estos sistemas basados en reglas presentan las siguientes características : 

1 - Incorporan conocimientos prácticos en reglas " SI... , Entonces ..." 

2 - Sus capacidades, en principio, aumentan al aumentar el tamanño de sus B. C. 

Puesto que cada regla representa un "átomo " de conocimiento , estos pueden 
acumularse gradualmente , aumentando la potencia del sistema. 

3 - Pueden resolver problemas de cierta complejidad seleccionando reglas relevantes, y 

combinado resultados de manera adecuada . 

4 - Determinan adaptativamente la mejor secuencia para ejecutar las reglas . 

5 - Explican sus conclusiones por medio de un seguimiento de la cadena de razonamiento 

ejecutada , y traduciendo a lenguaje natural la lógica de cada regla aplicada . 
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Los conocimientos representados en las reglas pueden ser , por ejemplo : 

1 - Inferencias específicas que se siguen de observaciones específicas. 

2 - Abstracciones, generalizaciones y categorizaciones de datos dados. 

3 - Condiciones necesarias y suficientes para conseguir algún objetivo. 

4 - Lugares más prometedores para buscar información pertinente. 

5 - Estrategias preferidas para eliminar incertidumbre y disminuir otros riesgos. 

6 - Probables consecuencias de situaciones hipotéticas. 

7 - Probables causas de síntomas . 

El siguiente ejemplo ilustra el tipo de reglas que se pueden incorporar en un S. E.., en este caso en un 
dominio legal relativo a demandas : 

Si el demandante recibió lesión en un solo ojo 

y el tratamiento para el ojo requirió cirugía 
y la recuperación de la lesión fué casi completa 
y la agudeza visual se redujo ligeramente debido a la lesión 
y la condición es estable 

entonces incremente el factor de trauma por lesión en $ ó'OOO.OOO.oo 

Si la lesión del demandante causó incapacidad temporal de una función importante 
y los médicos del demandante no estban seguros de si la lesión era temporal 
y la recuperación del demandante fué casi completa 
y la agudeza visual se redujo ligeramente debido a la lesión 
y la condición es estable 

entonces incremente el factor de temor en $ 500.000 .oo por cada día . 

Si el demandante no usaba anteojos antes de la lesión 

y la lesión del demandante requiere que este use anteojos 

entonces incremente el factor de pérdida de facultad en $ 600.000 .oo 
e incremente el factor de inconveniencia en $ 550.000 .oo 

En una buena herramienta para sistemas expertos, las reglas pueden más información, por ejemplo 
como se ilustra en la siguiente estructura : 


CONTENIDA EN CONJUNTOS 


SI < ANTECEDENTE > IeNT 

*••••••* 1 ••••••■ 1 • • • 

ONCES < CONSECUENTE > 

FECHA 

HORA AUTOR 


t t t 

■•■■■■•i _IvI-M-.-l_I...-. 


TRADUCCION ¿ 

\l ESPAÑOL :Í:Í:Í:;:Í:Í:;:Í:Í:;:Í:Í:;:Í:Í:;:Í:Í:; 


ACTIVADA ? 

* * f 



# # * 


la información adicional permite que el sistema soporte otras funciones : Saber a que conjuntos 
pertenece la regla, fecha y autor de la regla, traducción de la regla en un lenguaje más orientado al 
usuario , etc. 
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Las reglas utilizadas en los S.E. frecuentemente no relacionan de manera 100 % determinista sus 
premisas con su conclusión, sino que son reglas heurísticas aproximadas, indican que dadas las 
premisas, es mas o menos probable que se verifique su conclusión, por ejemplo : 

Si 

la lluvia acumulada hasta el momento en la zona A es baja 

y 

el nivel de empapamiento del suelo es húmedo 

entonces 

probablemente en el barranco B habrá caudal bajo dentro de una hora. 


Y una regla del sistema DENDRAL que asocia las características de un espectrograma de masas con la 
probable existencia de determinados átomos o radicales : 

Si 

Hay un pico alto en el valor numero_atómico/carga =71 

y 

Hay un pico alto en el valor numero_atómico/carga = 43 

y 

Hay un pico alto en el valor numero_atómico/carga = 86 

y 

Hay un pico alto en el valor numero_atómico/carga =58 

entonces 

debe existir una subestructura N-PROPIL-QUETONA_3. 

Para manejar estos conocimientos "aproximados", en los cuales hay incertidumbre, se han ideado 
métodos especiales, que veremos en el capítulo 7 . 

Aunque las reglas son conceptualmente muy sencillas, con ellas pueden surgir varias dificultades, 
entre ellas : 

1- Sobrecarga por gran cantidad de reglas. 

2- Problemas con el manejo de la incertidumbre 

3- Inadecuación respecto a la estructura del problema. 


SOBRECARGA POR GRAN CANTIDAD DE REGLAS 

El desarrollo de grandes conjuntos de reglas tiende a originar dos tipos de dificultades para el 
Ingeniero del Conocimiento : Posible ejecución ineficiente, y bases de reglas de difícil mantenimiento. 

Ela ejecución ineficiente se presenta si el M.I. no posee un sistema eficiente de comparación de 
patrones, o si el conjunto de reglas excede la capacidad de memoria RAM dedicada (lo cual origina 
muchas referencias a disco) . 

Por otro lado, la capacidad de alguien para hacer un seguimiento de las relaciones lógicas dificulta el 
manejo de conjuntos de reglas . Como guía práctica , J.R. Walters y N.R. Nielsen recomiendan 
procurar estructurar el conjunto de reglas en subconjuntos de menos de 50 reglas cada uno . Si nos 
parece que el problema no se puede descomponer de manera muy natural en tales subconjuntos, se 
deben considerar una representación direfente del problema o una organización diferente de la base de 
conocimientos . 
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PROBLEMAS CON EL MANEJO DE LA INCERTIDUMBRE 

Los métodos numéricos para manejar la incertidumbre, como los que veremos en el capítulo 7 , en 
general asumen el cumplimiento de ciertas relaciones lógicas (por ejemplo que no haya correlación 
entre ciertos fenómenos) , pero es muy difícil para el I.C. asegurar que las relaciones se cumplen 
sobre un conjunto grande de reglas . 


INADECUACION RESPECTO A LA ESTRUCTURA DEL PROBLEMA 

A veces la estructura del conocimiento de un problema no se acomoda de manera natural a determinada 
forma de representación, como puede ser el caso de utilizar una herramienta que proporciona 
solamente reglas para un problema que parece requerir otras estructuras para representar objetos 
complejos, siendo en ese caso más deseable una herramienta que también maneje Marcos. 


METARREGLAS 


Aunque las reglas representan una estructura de conocimientos relativamente simple, estas se pueden 
usar de diferentes maneras; por ejemplo, algunas reglas pueden controlar la utilización de otras reglas. 

Podemos hacer una analogía con el caso de una pequeña empresa que se expande: inicialmente todos 
los empleados están involucrados más o menos directamente en todas las actividades, pero más tarde, 
al volverse más compleja la compañía, se requiere que algunos empleados administren las actividades 
de los otros empleados. 

Lo mismo puede ocurrir en un S.E.: Cuando hay pocas reglas en la B.C., cada regla representa parte 
del dominio del conocimiento. Al aumentar el número de reglas, es necesario organizar las actividades 
de las reglas. Se desarrollan "metarreglas" para este fin. 

Una metarregla se escribe como una regla, frecuentemente tiene la forma: 


o 


Si 

intentamos evaluar tal objeto, 

entonces 

utilizar las reglas que tienen tales características. 


Si 

se está en tal situación, 

entonces 

utlilizar las reglas que tienen tales características antes que otras. 


Por ejemplo, en un sistema consejero financiero, una metarregla puede ser: 


Si 

La edad del cliente es mayor de 65 años 

y 

hay reglas que mencionan "bajo riesgo" en sus premisas 


y 

hay reglas que mencionan "rieso especulativo" en sus premisas 

entonces 

utilice el primer conjunto de reglas antes de utilizae cualquiera de las últimas 
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Puede ser difícil agregar este tipo de metaconocimiento a la B.C. Un problema con esto, es que puede 
haber excepciones, así, refiriéndonos al ejemplo anterior, puede haber personas mayores de 65 años 
que ya poseen ingresos asegurados y están interesados en riesgos especulativos. 

De todas maneras, las METARREGLAS proporcionan una manera de organizar y ayudar a manejar la 
complejidad de una gran cantidad de reglas. Los sistemas que incluyen meta-reglas tienen cierta 
complejidad porque el efecto de una metarregla se distribuye, en principio, através de toda la B.C. al 
controlar la secuencia de ejecución de las reglas. 


5.5.4. ARQUITECTURAS CON TABLERO O PIZARRON 

Las arquitecturas con tablero son una evolución natural de la arquitectura "clasica" de los SS.EE. la 
mayoría de tales sistemas tienen dos debilidades : 

1 - El control de la aplicación del conocimiento está implícita en la estructura de la base de 

conocimientos; por ejemplo, en el orden de las reglas . 

2 - La representación del conocimiento depende de la naturaleza del M.I., por ejemplo, un 

interpretador de reglas solamente puede trabajar con conoci mi entos expresados como 
reglas . 


En la arquitectura de tablero, se organiza el conocimiento en módulos separados denominados "fuentes 
de conocimiento" (inglés: "Knowledge Sources") , cada fuente de conocimiento posee su propia báse 
de conocimiento y mecanismo de inferencia . Las diferentes fuentes de conocimiento comparten una 
estructura de datos denominada "tablero", "pizarra" o "pizarrón" (inglés: "blackboard") , en la cual 
cada una contribuye de manera oportunista a la solución del problema. 

Las arquitecturas con tablero tienen sus orígenes dentro de la I. A. en el modelo propuesto por 
Selfridge en 1959 para el reconocimiento del habla. También fué elaborado este concepto en 1962 por 
Alien Newell, pero realmente se vino a consolidar como una arquitectura práctica en el sistema de 
reconocimiento del habla HEARSAY II , desarrollado entre 1971 y 1976 por Lee Erman y Raj 
Reddy . Las etapas en las que se han desarrollado estas arquitecturas son : 

1 - Desarrollo de Hearsay II (1971-1976) 

2 - Primeras aplicaciones (1975-1980) 

3 - Generalizaciones: desarrollo de herramientas (1977-1984) 

4 - Difusión. 

5 - Extensiones y refinamientos. 


El nombre de "tablero" proviene de una analogía con una situación en la cual tuviéramos reunidos en 
un salón y frente a un tablero, a un grupo de expertos, cada uno especialista en un subdominio. 
Escribimos en el tablero la formulación inicial del problema, y los expertos empiezan a pensar. Cada 
que uno de ellos tiene algo que aportar (idea interesante, hipótesis, etc.) lo escribe en el tablero para 
que todos lo vean, lo cual ayuda a los demás expertos. Al final habrá uno que de el ultimo paso para 
resolver el problema. La solución se habrá logrado solo gracias al aporte de los diversos especialistas. 

Las arquitecturas con tablero permiten aprovechar diversos tipos de conocimiento, por ejemplo en el 
sistema pionero Hearsay II se utilizaron 12 fuentes de conocimiento, como : fonético, gramatical, etc. 
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ESQUEMA DE UNA ARQUITECTURA CON TABLERO 



TABLERO 



En muchosa casos el problema se puede descomponer en niveles de detalle, 
y existen conocimientos especializados que parten de datos de un nivel 
para concluir estructuras de nivel superior. Aquí el tablero se muestra 
dividido en niveles o paneles Ni , los conocimientos son los Ci. 
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Estas arquitecturas son apropiadas cuando parece natural subdividir el problema en diversos aspectos 
o niveles de detalle, como en el caso de la comprensión del habla, donde, partiendo de los sonidos 
hasta llegar a la comprensión hay diversos niveles y para cada uno de ellos existen tratamientos 
diferentes: sonidos, fonemas, palabras, sintaxis, semántica, etc. Si los expertos usan una 
metodología jerárquica de solución, este es un indicio de la posible aplicabilidad de este enfoque. 


5.5.5. UTILIZACION DE MODELOS 

No todo el conocimiento puede ser capturado en reglas de produccioón ni en los otros esquemas que 
hemos visto. Los expertos utilizan también otras formas de conocimiento en su razonamiento. Por 
ejemplo, ellos pueden utilizar información de relaciones de comportamiento complejas, y relaciones 
matemáticas, que no son adecuadas para representarlas como reglas, o redes semánticas o marcos. 

Todos los sistemas de representación de conocimientos que hemos visto se catalogan como modelos o 
conocimiento superficial (inglés: "shallow" o "surface") . 

Algunas limitaciones de los S.E. se podrían superar al incorporar a estos modelos del comportamiento 
de los objetos representados, y detalles de sus relaciones causales, tendiéndose a tener un modelo o 
conocimiento denominado más profundo (inglés: "deep") . También se dice que en estos caso se 
razona a partir de "principios básicos" o "primeros principios". 

La idea es que cuando los conocimientos superficiales sean insuficientes, el S.E. pudiera recurrir a una 
especie de simulación en un modelo causal de la situación, para razonar. Pero, aunque esto parece 
ideal, precisamente se desarrollaron los S.E. actuales para atender problemas en los que no 
disponemos de otros modelos eficaces. De todas maneras existe la tendencia a incorporar cada vez 
más conocimientos más profundos de los objetos, sus comportamientos y relaciones dentro de los 
SS.EE. Esto se puede lograr más fácilmente en casos como el diagnóstico de circuitos o máquinas, 
donde es más factible tener modelos causales detallados. 


6. LA INFERENCIA 


El Mecanismo de Inferencia decide cómo utilizar el conocimiento del sistema desarrollando una 
AGENDA que organiza los pasos para resolver el problema actual. Contine las funciones de: 

1- INTERPRETADOR, generalmente "interpretador de reglas" que ejecuta items escogidos de la 

Agenda, aplicando las reglas correspondientes de la base . 

2- PLANIFICADOR (inglés: "scheduler"), que mantiene control la Agenda para controlar la 

secuencia de aplicación de reglas según algún criterio de prioridades. 


MECANISMOS BASICOS DE INFERENCIA: ENCADENAMIENTOS HACIA ATRAS Y 
HACIA ADELANTE 

Teniendo una B.C., por ejemplo con las siguientes reglas y hechos que se ilustran en la tabla 
siguiente: 
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Reglas: 

Base de Hechos verdaderos inicial: 

R1 

A => E 

H , K 

R2 

B => D 


R3 

H => A 


R4 

E y G => C 


R5 

E y K => B 


R6 

D y E y K => C 


R7 

G y K y F => A 



Existen dos estrategias básicas para activar las reglas, denominadas Encadenamiento hacia Adelante 
(inglés: "Forward Chaining") y Enacdenamiento hacia Atrás (inglés: "Backward Chaining"): 


1- ENCADENA MI ENTO HACIA ADELANTE : 

Al verificarse las premisas de ciertas reglas, se verifican su conclusiones, y luego, si estas 
conclusiones son a su vez premisas de otras reglas, entonces de verifican también las 
conclusiones de esas otras reglas, y así sucesivamente, por ejemplo: 


Activación de reglas: 

Conclusiones 

R3 H => A 

A, H, K 

R1 A => E 

A, E, H, K 

R5 E y K => B 

A, B, E, H, K 

R2 B => D 

A, B, D, E, H, K 

R6 D y E y K => C 

A,B,C, D, E, H, K 


2- ENCADENAMIENTO HACIA ATRAS : 

Se trata de probar un hecho que se toma como hipótesis, y entonces se busca una regla 
cuya conclusión se esa hipótesis. Si esa regla puede satisfacerse con las conclusiones 
verificadas hasta el momento, ha terminado la tarea de verificar la hipótesis. Si las 
premisas de la regla no están verificadas, entonces se consideran como nuevas hipótesis a 
concluir y se aplica iguak proceso a esas nuevas hipótesis . Esto es lo que se conoce como 
modusponens. Por ejemplo: 
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Sea C el hecho a probar, entonces : 


Hipótesis a Probar 

Activación de reglas: 

C 

R4 E y G => C 

E 

R1 A => E 

A 

R3 H => A 

H 

verificado ya 

G 

no podemos verificarlo 

C 

R6 D y E y K => C 

D 

R2 B => D 

B 

R5 EyK => B 


3.1.4. MEMORIA DE TRABAJO 

Es un área de memoria (inglés: " workspace ") reservada para la descripción del problema actual, tal 
como lo especifican los datos de entrada; también se usa para registrar resultados intermedios. 
Conserva hipótesis y decisiones intermedias de tres tipos: 


- PLAN: 


Cómo atacar el problema. 
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- AGENDA: Acciones potenciales que esperan ejecución. 

- SOLUCION: Hipótesis candidatas y cursos de acción alternativos que el sistema ha generado hasta 

el momento. 

La memoria de trabajo también se llama "Tablero", "Pizarra" o "Pizarrón" ( inglés: "Blackboard" ), 
pero se utiliza este término, especialmente cuando el sistema completo se compone de varios módulos, 
siendo cada uno un S.E. especialista en determinado nivel de detalle o de descripción del problema 
(sección 5.5.4 ) . 


7. LA INCERTIDUMBRE Y EL 

RAZONAMIENTO APROXIMADO 


Existen diversas razones por las cuales se presenta incertidumbre en los conocimientos, por ejemplo : 

- Conocimiento Incierto : El experto puede tener solamente un conocimiento 

heurístico o empírico respecto a algunos aspectos del 
dominio. Por ejemplo, que cierto conjunto de evidencias 
implican probablemente determinada conclusión. 

- Datos Inciertos : Aun cuando tengamos certidumbre del conocimiento, por 

ejemplo de una relación causa-efecto , la certeza de los 
datos puede ser cuestionable . 

Entonces, para la aplicación de una regla, en general puede haber incertidumbre tanto en cuanto al 
grado en que se cumple cada premisa, como en lo determinada que quede la conclusión dado que se 
verifiquen las premisas, o sea, en una regla como : 

Si A y B entonces C 

- Dados A y B verdaderos, qué tan seguros podemos estar de que se cumple C ? 

(en otras palabras: cual es la confiabilidad de la regla en sí ? ) . 

- Qué tan seguros estamos de que se cumple A ? 

- Qué tan seguros estamos de que se cumple B ? 

También se origina incertidumbre por : 

- Información Incompleta : Con frecuencia es necesario tomar decisiones con 

información incompleta. A veces debemos asumir alguna 
información " por defecto ". 

- Azar : A veces en el dominio hay elementos que debemos tratar 

como aleatorios . 

Para manipular conocimientos inciertos en los SS.EE. se han utilizado diversos métodos, por ejemplo 
: El razonamiento no-monotónico, la teoría de probabilidades, los factores de certeza, procedimientos 
basados en lógica borrosa (inglés: "Fuzzy Logic" ) , la teoría de la evidencia de Dempster-Shafer, 
etc. 

Los métodos tratan, tanto de cómo se considera la incertidumbre de los eventos básicos, así como de 
las maneras como se combinan esas incertidumbres en proposiciones lógicas: Y , O , y en la 
aplicación de reglas (en general también inciertas) para producir conclusiones. En otras palabras: 
Cómo se calculan las certezas de proposiciones lógicas y de las conclusiones de reglas, a partir de las 
certezas de los hechos elementales y de las reglas. 
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7.1. RAZONAMIENTO NO MONOTONICO 

Los sistemas de razonamiento basados en lógica de predicados son conceptualmente elegantes, 
rigurosos y precisos. Utilizando la lógica formal se puede deducir la verdad, y nunca se genera 
contradicción, siempre que no exista contradicción en los axiomas. Por esto, la lógica de predicados 
es un sistema de razonamiento monotonico : se mueve en una sola dirección, y continuamente agrega 
verdades. El número de hechos conocidos como verdaderos en cualquier momento nunca disminuye. 

Esta característica de la lógica de predicados limita su aplicabilidad en el mundo real, ya que : La 
información disponible en un punto de decisión dado con frecuencia es incompleta, y existe la 
necesidad de lograr una "adivinación" ( asumsión ) razonable, aunque posiblemente incorrecta, 
cuando de otra forma el razonamiento se hallaría en un callejón sin salida. 

Al tratar con estas dificultades, los humanos "aumentamos" las verdades con suposiciones que están 
sujetas al cambio si tuviéramos más información. Son creencias tentativas o supuestos hechos ante la 
falta de evidencia contraria. Por ejemplo, cuando tomamos la decisión de abordar un avión, asumimos 
que el piloto y la nave están en perfectas condiciones para el vuelo. Un sistema de razonamiento no 
monotonico se basa en este principio, y por eso el número de hechos conocidos como verdaderos en 
cualquier momento puede disminuir, al recibirse más i nf ormación. 


7.2. METODOS PROBABILISTICOS 

Recordando las fórmulas para calcular las probabilidades de la conjunción y la disyunción de eventos. 
Siendo los eventos A y B independientes : 

P(A y B) = P(A) * P(B) P(A o B) = P(A) + P(B) - P(A)*P(B) 

Y para calcular las probabilidad condicional de la hipótesis H dada la evidencia E, a partir de la 
probabilidad a priori de H , P(H), y de la probabilidad de E , P(E): 

P(H I E) = P(H y E)/P(H) 

También disponemos de otra fórmula para calcular esta probabilidad, basándonos en el teorema de 
Bayes : 


P(H I E) = P(H)*P(E I H) / P(E) 

Cuando se tienen varias hipótesis H k , ( con 2 P(H k ) = 1 ) , estando cada una relacionada con la 

evidencia E , entonces tenemos que la probabilidad condicional de la i - ésima hipótesis , dada la 
evidencia E, es : 


PCHp * P(E I H¡) 

P(Hj IE) = - 

2 [ P(H k ) * P(E I H k ) ] 

La probabilidad condicional P(H I E) es para nuestros efectos el nivel de creencia en la hipótesis H 
revisado tras el hallazgo de E . 


7.2.1. PROBLEMAS DE LA APLICACION DE LA TEORIA DE PROBABILIDADES 
A LA INCERTIDUMBRE DE LOS SS.EE. 
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1 - Se requiere conocer la probabilidades involucradas, lo cual no es siempre posible. 

2 - Es matemáticamente correcta, pero ciertas fórmulas son válidas asumiendo independencia de los 

eventos, pero no siempre estamos seguros de que los eventos de nuestro caso no están 
correlacionados (por ejemplo: dos síntomas para un caso de diagnóstico). 

3 - Al aumentar la Base de Conocimientos es difícil modificar una probabilidad, para actualizarla, sin 

causar efectos que se propaguen y violen lo asumido para garantizar la validez de las fórmulas, por 
ejemplo, se puede violar que 2 P(H¡) = 1 

4 - Realmente la teoría de probabilidades se originó para estudiar los casos en los que dan muchos 

eventos posibles, y existe un muestreo, y estadísticas, etc. pero en cambio para el caso de los 
conocimientos para un S.E. tratamos con grados de creencia que casi siempre son subjetivos y en 
el fondo no están realmente muy relacionados con ningún muestreo y ningunas estadísticas. 

5 - En la práctica se usan estos métodos viéndolos como un método de combinar valores inciertos, 

pero olvidándonos realmente de su origen y sus estrictos fundamentos teórico-matemáticos. 


7.3. FACTORES DE CERTEZA 

Se puede asignar un valor de certeza, denominado "factor de certeza" a cada hecho. Esta es una 
cuantificación subjetiva del juicio y la intuición del experto. Luego se define la manera de calcular el 
Factor de Certeza ( FC ) que tienen las combinaciones lógicas de los hechos, en función de los 
Factores de cada hecho. 

Se parte de dos estimaciones subjetivas MC y MD ; definidas así : 

MC(C,E) = medida en la cual nuestra creencia en la conclusión C se incrementa ante la 
evidencia E. Por definición : 0 £ MC(C,E) < 1 

MD(C,E) = medida en la cual nuestra no creencia en la conclusión C se incrementa ante la 
evidencia E. Por definición : 0 < MD(C,E) < 1 

Estas dos medidas son independientes, no son probabilidades ( aunque en sus valores extremos 
pueden tener la interpretación de probabilidad). Por lo tanto una no es el complemento de la otra. 
Además, para cualquier regla dada : 

si MC(C,E) > 0 entonces MD(CE) = 0 
si MD(C,E) > 0 entonces MC(CE) = 0 

Estas dos medidas se combinan en un solo FACTOR DE CERTEZA FC(C,E) así: 

FC(C,E) = MC(C,E) - MD(C,E) 

Como en general para una conclusión dada C hay varias reglas , en este caso E debe considerarse 
como todas las evidencias que se han considerado hasta el momento relativas a C . 

Resulta una escala de valores entre -1 y +1 , para la certeza de un hecho, correspondiendo el -1 a los 
hechos ciertamente falsos, y 1 a los hechos verdaderos. Un hecho que tiene alguna evidencia de ser 
falso recibe un factor negativo , y un hecho que tiene alguna evidencia de ser verdadero recibe un 
factor positivo. Se puede considerar que los valores cercanos a cero significan que no se tiene 
evidencia suficiente de que el hecho sea falso ni de que el hecho sea verdadero . Representamos por 
FC(A) el factor de certeza del hecho A, y por FC( A, B ) el factor de certeza de la hipótesis A dada 
la evidencia B. 


Gráficamente: 
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Los factores de certeza (FC) de la conjunción y la disyunción de dos hechos: 

FC( A y B ) = min( FC(A) , FC(B)) 

FC( A o B ) = max( FC(A) , FC(B)) 

Para las reglas, un uso común es asociar con la conclusión de cada regla el valor FC , por ejemplo : 
Regla R 17 : Si 

la inflación es superior al 5 % 

entonces 

los valores de las acciones bajan , FC = 0.7 

En el caso de las reglas, el factor de certeza de la conclusión se obtiene multiplicando los factores de la 
premisa y la conclusión. 

Sea la regla: Si premisa entonces conclusión , con FC(regla) 
entonces FC( conclusión) = FC(premisa) * FC(regla) 


A menudo un S.E. necesita calcular factores de certeza resultantes de los efectos combinados de varias 
reglas. Por ejemplo: 


1 - Evidencias simultáneas para la misma conclusión : 



El A E2 

FC(C, El A E2) 


t 

C 


♦ Si para una misma conclusión C , disponemos de dos evidencias : El y E2, y 
conocemos FC( C, El) y FC( C, E2 ), el factor de certeza de la hipótesis, dadas 
ambas evidencias, o sea FC( C, El y E2 ), se calcula así: 

Si FC(C,E1) y FC(C,E2) son de signos iguales, entonces : 

FC(C, El y E2) = FC(C, El) + FC(C, E2) - FC(C, El) * FC(C, E2) 

Si FC(C,X2) y FC(X1,X3) tuvieran signos opuestos, entonces sería: 

( FC( C, El ) + FC(C,E2) ) 
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FC(C, El y E2) = - 

(l-min( I FC(C, El) I , I FC(C, E2) I)) 

Ejemplo: sean las dos reglas : 

Regla R 18 : Si 

la inflación es i nf erior al 5 % 

entonces 

los valores de las acciones subirán , FC = 0.7 

Regla R 19 : Si 

el desempleo es menor del 7 % 

entonces 

los valores de las acciones subirán , FC = 0.6 

Asumamos que se presume que la inflación del próximo año será 4 % y el desempleo será del 6.5 %, 
o sea que las premisas de ambas reglas son verdad, con certeza 1 . El efecto combinado es : 

FC(C, El y E2) = FC(C, El) + FC(C, E2) - FC(C, El) * FC(C, E2) 

FC(C, El y E2) = 0.7 + 0.6 - 0.7*0.6 = 0.1 - 0.42 = 0.88 

Otro ejemplo, sean las dos reglas R 31 y R 32 : 

Regla R 31 : Si 

la compañía X usa alta tecnología 

y 

las acciones de la compañía X están en alta demanda 

entonces 

las acciones de la compañía X son "volátiles", 

FC = 0.6 

Regla R 32 : Si 

las acciones de la compañía X son una nueva emisión 
o 

las acciones de la compañía X son muy comercializadas 

entonces 

las acciones de la compañía X son "volátiles" , 

FC = 0.7 

Asumamos que tenemos las siguientes certezas sobre los hechos de las premisas : 

FC(la compañía X usa alta tecnología) = 0.9 

FC(las acciones de la compañía X están en alta demanda) = 0.6 

FC(las acciones de la compañía X son una nueva emisión) = 0.8 

FC(las acciones de la compañía X son muy comercializadas) = 0.4 

Para cada regla R 31 y R 32 se calcula primero el FC de las premisas, y luego se multiplica por el 
FC de la regla. Obsérvese que la premisa de R 31 es conjunción y la de R 32 es una disyunción : 

FC(las acciones de la compañía X son "volátiles", R 31) = min(0.9,0.6) * FC(R 31) = 0.6 * 0.6 = 
0.36 

FC(las acciones de la compañía X son "volátiles", R 32) = max(0.8,0.4) * FC(R 32) = 0.8 * 0.7 = 
0.28 
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Entonces, como tanto R 31 como R 32 contribuyen a la misma conclusión, el FC de la 
conclusión, considerando ambas reglas será : 

FC(las acciones de la compañía X son "volátiles", R 31, R 32) = 0.36 + 0.56 - (0.36 * 0.56) 

= 0.72 

Si la misma hipótesis es soportada por más de una regla, se aplica la misma fórmula, por ejemplo, si 
una regla R 33 ,con FC = 0.8 soportara la misma conclusión que R31 y R32, tendríamos: 

FC(las acciones de la compañía X son "volátiles", R 31, R 32, R33) = 0.72 + 0.8 - (0.72 * 
0.8) = 0.94 



♦ Si tenemos una regla con premisa E y conclusión C1 con factor de certeza FC(C1, E), y 
otra regla con premisa C1 y conclusión C con factor de certeza FC(C, Cl), 
entonces el factor de certeza FC(C, E) se calcula así: 

Si FC(C1, E) > 0 , entonces : FC(C, E) = FC(C1, E) * FC(C, Cl) 

Si FC(C1, E) < 0 , entonces : FC(C, E) = - FC(C1, E) * FC(C, Cl )) 


7.4. LOGICA BORROSA O RAZONAMIENTO DIFUSO 

Rutinariamente colocamos las cosas en clases que aunque tengan significados bien definidos, muchas 
veces sus límites no están bien definidos. 

En la matemática convencionalel concepto de CONJUNTO requiere una definición tal que sepamos 
con certeza absoluta si un elemento x pertenece o un conjunto dado, inclusive para conjuntos con 
infinitos elementos. 

Sinembargo, conjuntos como : el de los automóviles grandes, el de los caballos rápidos, o el de 
personas altas, no están tan bien definidos. La teoría de conjuntos borrosos (inglés: Fuzzy Sets) , 
iniciada por Lofti Zadeh , maneja la pertenencia de un elemento x a un conjunto X asignándole un 
"valor de pertenencia" entre cero y uno. Cero indica que el elemento no pertenece al conjunto, y uno 
indica que el elemento definitivamente si pertenece al conjunto X . 

Por ejemplo, una persona tiene un grado de pertenencia entre cero y uno al conjunto "personas viejas 
",1o cual lo podemos ilustrar por medio de una función de pertenencia, según la edad de la persona, 
así, una persona recien nacida tendrá un valor de pertenencia muy cercano a cero, y su pertenencia al 
conjunto es mayor a medida que su edad aumenta. 
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estos grados de pertenencia tiene una traducción directa a las certeza de la expresiones de hechos, por 
ejemplo : consideremos el hecho: " María es vieja " , si la edad de María es de 70 años, podemos 
asignar, por ejemplo un valor de verdad de 0.9 . Designando por mX(x) el valor de pertenencia de 
x al conjunto X , tenemos : mVIEJOS(María) = 0.9 

Hay que comprender que no se trata de una probabilidad, como sería : "hay un 90% de probabilidad 

de que María sea vieja", sino que :" el grado de pertenencia de María al conjunto de gente vieja es 0.9 
!! 

Ambas afirmaciones son muy diferentes : El enfoque probabilístico presupone que María es vieja o no 
lo es y tenemos incertidumbre en cuanto a " a cual de esos dos conjuntos pertenece. 

La lógica borrosa supone que María es más o menos vieja, y que la incertidumbre es un propiedad 
inherente al estado de María, y no refleja simplemente incertidumbre en la información que tenemos 
acerca de María . 



DEFINICIONES FORMALES 

Sea X el conjunto de elemento representados por x , entonces : x = { X } 

Un subconjunto borroso A en X se caracteriza por una función de pertenencia mA(x) , que 
proyecta cada objeto de X dentro del intervalo de números reales [0,1] . 0 < mA(x) < 1 

- El conjunto A es vacío si y sólo si: pra todo x : mA(x) = 0 

- Los conjuntos A y B son iguales si y sólo si: pra todo x : mA(x) = mB(x) 

- Siendo C el complemento de A , entonces : mC(x) = 1 - mA(x) 

- A es subconjunto de B si y sólo si: mB(x) a mA(x) 

-Si U es unión de Ay B , o sea U = A U B entonces : mU(x) = max( mA(x), mB(x)) 

-Si I es intersección de A y B , entonces : ml(x) = min( mA(x), mB(x)) 
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Véase que, por ejemplo en los casos de la unión y la intersección da resultados muy diferentes a si se 
interpretaran los grados de pertenencia conmo probabilidad : 

Sea A el conjunto de la gente muy alta y sea B el conjunto de la gente muy ingeniosa 
Sean : " Juanes alto ", con mA(x) = 0.5 y " Juan es ingenioso ", con mB(x) = 
0.5 

Asumiendo independencia de los eventos, si estos valores fueran probabilidades, la 
probabilidad de que Juan se muy alto y muy ingenioso sería 0.5 * 0.5 = 0.25 . 

Pero como realmente son valores de pertenencia, mAUB(x) = min(0.5 ,0.5)= 0.5 
O sea que Juan pertenece en grado 0.5 al conjunto de gente alta e ingeniosa 


7.5 TEORIA DE LA EVIDENCIA DE DEPSTER-SHAFER 

Se asigna un número entre 0 y 1 para representar el grado de soporte que un cuerpo de evidencia da a 
una proposición. Aunque formulada así se parece a las probabilidades bayesianas, sinembargo esta 
teoría es más general. 

La teoría de probabilidades requiere que la probabilidad de de ocurrencia de un evento P(A), y la 
probabilidad de que el evento no ocurra P(-> A) sumen 1 , pero en la práctica nuestra CREENCIA en 
ambas puede ser cero, si no tenemos evidencia en ningún sentido. 

Si a un detective en la escena de un homicidio le pedimos que nos cuentifique su grado de creencia en 
que "el culpable es el mayordomo", el detective puede responder con "cero", y sinembargo puede 
también responder "cero" para "el mayordomo no es el culpable", en este caso el detective realmente 
está indicando que no tiene información en uno ni otro sentido. 

Aunque asignar valores a la CRENCIA tiene sentido en términos de nuestra experiencia, la signacion 
de probabilidades es rígida; por ejemplo, si el detective asigna un aprobabilidad de "cero" a "el 
culpable es el mayordomo" simultáneamente está asignando una probabilidad de "uno" a "el 
mayordomo no es el culpable", pero esos valores no reflejan la indecisión en las creencias del 
detective: Desde el punto de vista del detective no se puede llegar ya a una conclusión , en cambio la 
asignación de probabilidades obligaría a una conclusión. 

La base de la teoría de Dempster-Shafer es la definición de una Función de Creencia o 
CREDIBILIDAD Comenzamos con un conjunto de eventos posibles a los cuales asignamos valores 
de creencia que reflejen cuán fuertemente creemos que el evento es cierto. Supongamos que se 
presenta una falla que hace pensar al experto en una de tres causas : C^ , C 2 , C 3 

Para el Cálculo de Creencias, el conjunto de eventos posibles es: E = {C^ , C 2 , C 3 }. 

Las probabilidades bayesianas realmente son un caso especial de las funciones de creencia : El cálculo 
de creencias de Dempster-Shafer sirve como una generalización de los conceptos probabilísticos, pero 
precisamente por ser más amplio su alcance se puede usar para representar características de la 
incertidumbre que son difíciles o imposibles de representar usando los conceptos probabilísticos. Por 
ejemplo, el cálculo de creencias proporciona una manera natural de representar la ignorancia acerca de 
una situación. Ignorancia en este contexto significa que no tenemos evidencia para formar una opinión; 
por lo tanto, una función de creencia que represente un estado de ignorancia (llamada Función 
Creencia vacía), está dada por : 

0 si X * E 

Cr( X ) = { 

1 si X = E 

La Función de Creencia vacía indica que aunque sábenos que la respuesta correcta está en alguna parte 
en el conjunto total de posibilidades, no tenemos creencia similar acerca de algún subconjunto del 
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conjunto total de posibilidades. Así, las Funciones de Creencia nos permiten distinguir entre la falta 
de creencia (ignorancia), usando la Función de Creencia vacía, y un bajo valor de creencia. 

Fa Función de Creencia o Credibilidadno se define sobre este conjunto E, sino sobre el Conjunto 
Potencia de E, 

que está definido como el conjunto de todos los subconjuntos de E, y que convencionalmente 
se representa por: 2 E . 

Continuando con nuestro ejemplo: el experto construye ese conjunto potencia que contiene ocho 
elementos: 

2 E = { 0, { q}, { c 2 }, {C 3 }, {Cj, c 2 }, {q , c 3 }, { c 2 , c 3 }, {q, c 2 , c 3 } } 

siendo 0 el conjunto vacío, que es subconjunto de cualquier conjunto. 

El Experto puede expresar un grado de creencia para cada elemento de este conjunto. En general 
entonces, una Función de Creencia Cr() proyecta el conjunto potencia del conjunto de eventos en el 
rango [0,1], o sea: Cre : 2 E [ 0,1 ] 

Además, la Función Creencia debe satisfacer estas tres condiciones: 

1) Cr(0) = 0 

2) Cr(E) = 1 

3) Para cada entero positivo n y cada conjunto A,, A 2 ,..., A n de subconjuntos de E, se cumple: 
Cr(A, uA 2 u...uA n )> 2 Cr( A¡) - 2 Cr( A¿ « A¡) + ... + (-1) n+1 Cr( A : « .. . « Ai) 

i i<j 

A pesar del aspecto complejo de la condición 3, esta establece una restricción a los valores de creencia, 
de modo que si en nuestro ejemplo se asignan valores a "La causa es q " y a "La causa es C 2 ", o sea 

a Cr(C |) y Cr(C 2 ), la condición 3 establece que tiene que cumplirse que : 

Cr( q, C 2 ) a Cr( q ) + Cr( C 2 ) 

la creencia de que la causa está en el conjunto {q, C 2 } no puede ser menor que la suma de las 
creencias en la causalidades individuales de cada una. 

El objetivo del Cálculo de Creencias de Dempster-Shafer es generar los valores para la Función de 
Creencia. En lugar de solicitar al experto que asigne valores a Funciones de Creencia definidas sobre 
un conjunto de alternativas ( lo cual sería muy difícil ya que debe cumplir las tres condiciones ya 
formuladas), los valores se construyen a partir de asignaciones básicas de probabilidades que pueden 
ser determinadas por el experto. 

Una asignación básica de probabilidad es una función m que también proyecta el conjunto 
potencia del conjunto de eventos en el rango [0,1], como una Función de Creencia, pero con las 
únicas dos condiciones: 

i) m (0) = 0 

ii) 2m(X) = l 
S ... X 

La primera condición asegura que no se asigna probabilidad al conjunto vacío, y la segunda que la 

suma de las probabilidades asignadas sobre todos los conjuntos es uno. m (X) También se llama 
"número básico de probabilidad del subconjunto X ", o Masa Probabilística del subconjunto X. 
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La relación entre las Masas Probabilísticas asignadas a los subconjuntos del conjunto de eventos 
posibles y el Valor de Creencia asignado a cada subconjunto está dado por: 
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Cr(X) = 2 m (Y) 

X... Y 

o sea : la creencia en un subconjunto X es la suma de la Masa Probabilística m (Y) asignada a todos 
los subconjuntos Y de X , o , más claramente: La credibilidad de X es la suma de las probabilidades 

m de todos los subconjuntos que implican a X . 

Asumamos que, después de alguna investigación, el experto del caso ejemplo es capaz de asignar 
Masas Probabilísticas a todos los posibles escenarios, as: 



Obsérvense dos asuntos acerca de la asignación de Masa Probabilística : 

1- Una masa probabilística no es lo mismo que una probabiliad, porque, por ejemplo, sabemos 

que la probabilidad de que uno de los tres sea culpable es uno, pero la Masa asignada a 
la alternativa {Cj , C 2 , C 3 } es solamente 0.1 

2- Como lo exige la condición i i) vista antes, la suma de las Masas Probabilísticas es uno. 

Usando las Masas Probabilísticas asignadas por el experto, podemos determinar su grado de creencia: 

"La causa es C j" es Cr({ C j }) = 0.1 ya que el conjunto { C j } no tiene subconjuntos propios. 

"La causa es C 2 " es Cr({ C 2 }) = 0.2 por la misma razón. 

"La causa es C 3' 1 es Cr({ C 3 }) =0.1 por la misma razón. 

Para los otros casos usamos la relación entre la Credibilidad y la Masa Probabilística: 

Crdq , C 2 }) = m ({Cj} ) + m ( {C 2 } ) + m ( {C x , C 2 } ) 

= 0.1 +0.2+ 0.1 = 0.4 


y similarmente: 


Crdq ,C 3 }) = 0.3 
Cr({C 2 ,C 3 }) = 0.6 
Cr({C 1 ,C 2 ,C 3 }) = 1 
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Sinembargo, no basta con calcular estos valores, porque ellos tan solo dan una distribución de la 
incertidumbre sobre un conjunto de eventos posibles. Esperamos que a medida que consigamos más 
evidencia, la distribución de valores de creencia comience a indicar una solución específica o al menos 
un subconjunto pequeño que contenga la solución. Los valores calculados hasta aquí simplemente 
indican que tal vez C 2 es una buena candidata ya que todos los subconjuntos de alternativas que 

contienen a C 2 poseen mayores valores de creencia que subconjuntos equivalentes en los que C 2 no 
figura. 


UTILIZACION DE LOS VALORES DE CREENCIA 

Cualquier subconjunto X con un valor de masa diferente de cero ( m (X) > 0 ) se denomina un 
elemento focal de la función de creencia. La unión de todos los elementos focales se denomina 
núcleo de la función de creencia, y consiste de todos los elementos que contribuyen a la creencia 
total. 

Las funciones de creencia, además de representar grados de creencia e ignorancia, también se usan 
para representar diferentes niveles de incertidumbre. Por ejemplo, la creencia de que la respuesta 
correcta está en el conjunto X es cierta y precisa si se cumplen las tres condiciones siguientes: 

1) m (X) = 1 

2 ) m (Y) = 0 si B ^ A 

3) X es un subconjunto que contiene solo un elemento 

o sea que si se asigna toda la masa probabilística a un solo elemento no existe incertidumbre en la 
creencia. ( en el ejemplo, si el experto asigna una masa probabilística de uno a {C 2 } y cero a los 

otros subconjuntos, ello indicaría que el experto está seguro de que {C 2 } es la causa de la falla. 


Por otra parte, si se cumplen las siguientes relaciones: 

1) m (X) = 0 

2) m (Y) = 0 si B ^ A 

3) X es un subconjunto que contiene más de un elemento 

esto representa una situación de incertidumbre, por ejemplo, si en nuestro caso el experto asigna una 
masa probabilística de 1 al conjunto {C 2 , C 3 } y cero a los otros subconjuntos, él está seguro de que 

la causa de la falla es una de esas dos, pero es incapaz de determinar exáctamente cual de ellas. 


Se dice que una creencia es consonante si la evidencia es tal que los elementos focales forman una 
secuencia de la forma : 

Xi X 2 X 3 ... x n 

en este caso la evidencia es consistente. En nuestro caso, si se asignaran, por ejemplo : 

m({C 1 }) = 0 Craq» =0 

m ({C 2 }) = 0.2 Cr({C 2 }) = 0.2 
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m ({C 3 }) = 0 
m({C 1 ,C 2 }) = 0 
m({C 1 ,C 3 }) = 0 
m ({C 2 , C 3 }) = 0.4 
m({C 1 ,C 2 ,C 3 })=0.4 


Cr({C 3 }) = 0 
Cr({C l5 C 2 }) =0.2 
Cr({C 1 ,C 3 }) =0 
Cr({C 2 ,C 3 }) =0.6 
Cr({C 1 ,C 2 ,C 3 }) = 1 


tendríamos una creencia consonante y la secuencia sería : 

{C 1 ,C 2 ,C 3 } {C 2 ,C 3 } {C 2 } 


LA REGLA DE DEMPSTER 

Basándose en diferentes evidencias, podemos generar varias listas de Credibilidades. La regla de 
Dempster permite combinar esas Credibilidades en una sola. Se comienza con dos series de Masas 
Probabilísticas, asignadas para el mismo conjunto de eventos posibles, pero basadas en dos evidencias 
diferentes, se genera una Masa Probabilística compuesta que se usa luego para calcular la Credibilidad 
compuesta, la cual ya se fundamenta en las dos evidencias. 

Representando las Masas Probabilísticas asignadas según la primera evidencia por m j (A) , y las 

asignadas basándonos en la segunda evidencia por m 2 (A), la regla de combinación de Dempster dá 
la Masa Probabilística combinada como : 


2 "> 1 (A i )m 2 (A k ) 

Ai«Ak= A 

m (A) =- 

1_ 2 m l <A i )m 2 (A k > 

A i « A k= 0 

como el denominador debe ser diferente de cero, entonces debe ser : 

^ m 1 (A i )m 2 (A k ) < 1 
A i « A k= 0 

esta sumatoria representa la cantidad de masa probabilística que está distribuida en subconjuntos que 
no se intersectan (subconjuntos que no tienen nada en común). Si esto sumara uno, ello indicaría que 
toda la masa probabilística para cada creencia individual está asignada a subconjuntos que no se 
intersectan, o, en otras palabras, las dos crencias individuales no tienen nada en común: son totalmente 
contradictorias y no es factible combinarlas en una sola Credibilidad. El proceso de cálculo comienza 
por calcular el denominador de la fórmula para m (A) . 

Si en nuestro ejemplo, luego de haber asignado a las masas probabilísticas los valores de la Tabla I 
basándonos en una primera evidencia, tenemos una segunda evidencia, según la cual asignamos los 
valores mostrados en la Tabla II: 


TABLA II Asignaciones según una segunda evidencia 
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La causa es C^ , 

m 2 ({ Cj}) 

0.2 

La causa es C 2 , 

m 2 ({C 2 }) 

0.1 

La causa es C 3 , 

m 2 ({C 3 }) 

0.05 

La causa está entre C^ y C 2 , 

m 2 ({C 1 ,C 2 }) 

= 0.3 

La causa está entre C^ y C 3 , 

m 2 ({C 1 ,C 3 }) 

0.05 

La causa está entre C 2 y C 3 , 

m 2 ((c 2 , c 3 » 

0.1 

La causa es una de las tres, 

171 2 ({^T, C 2 , C 3 }) = 

0.2 


2 m (X) = 

1.0 


entonces, basados en los subconjuntos que no se intersectan, calculamos : 

2 m 1 (A i )m 2 (A k ) = 0.245 
A i « A k= 0 

y por lo tanto, el denominador de la expresión para m (A j ) es 1- 0.245 = 0.755 

luego se calcula el numerador para cada posibilidad, según subconjuntos que se intersecten, por 

ejemplo para da: 0.17 , entonces m ({C^}) = 0.17/0.755 = 0.225 

Así sucesivamente se calculan los demás numeradores y se dividen por 0.755, lográndose todos los 
valores m (A) , y por último, a partir de esos valores se calculan las Credibilidades Cr(A) . 

Los resultados para el ejemplo se presentan en la Tabla III, según lo cual la causa más sospechosa 
entre C^,C 2 y C 3 según ambas evidencias combinadas resulta ser C 3 . 


TABLA III Valores según ambas evidencia 1 

m ({C}}) = 0.225 

CrdC^) = 0.225 

m ({C 2 }) = 0.219 

Cr({C 2 }) = 0.219 

m ({C 3 }) = 0.25 

Cr({C 3 }) = 0.25 

m ({^,02»= 0.105 

Crd^^}) = 0.58 

m ({^, 03 })= 0.04 

0 ^ 0 ^ 03 }) = 0.484 

m ({C 2 ,C 3 })= 0.131 

Cr({C 2 ,C 3 }) =0.6 

m({C 1 ,C 2 ,C 3 })=0.03 

Cr({C 1 ,C 2 ,C 3 }) = 1 


Si tuviéramos una tercera evidencia, sus valores m 3 se podrían combinar de la misma manera . 


7.6. CONCLUSIONES 
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Actualmente no existe un único método aceptado por todos para tratar la incertidumbre y el 
razonamiento aproximado; cada método tiene sus defensores y sus críticos con argumentos más o 
menos convincentes. Sinembargo existen varias técnicas que dan resultados aceptables, y se 
implementan en las herra mi entas para desarrollo de SS. EE. Al aplicar uno de los métodos, se debe 
conocer si para el caso que nos interesa, se cumple alguna condición necesaria para que el método de 
tratamiento de la incertidumbre si es adecuado. 

Los valores numéricos con que se representa la certidumbre de hechos o y reglas se prestan para 
distintas interpretaciones según las personas, por ejemplo : 

a) - Fracción ( o porcentaje) de los expertos que tienen consenso sobre el hecho . 

b) - Frecuencia o probabilidad de que ocurra el hecho, basándose en la experiencia. 

c) - Grado subjetivo de confianza que tiene el experto sobre el hecho individual. 

Según ciertos investigadores 1 , las personas son mucho mejores para estimar frecuencias de hechos 
basándose en la experiencia (caso b) que para estimar la certeza de hechos individuales (caso c) 2 . 

Un paquete de software para el desarrollo de SS.EE. debería permitir al usuario escoger el método 
adecuado para manejar la incertidumbre. 

Debe tenerse precaución al sacar estimaciones de certeza a partir de opiniones, ya que hay tendencia a 
polarizarse o no ser objetivo, por razones que estudia la sicología. Por ejemplo, tenemos tendencia a 
sobreestimar la probabilidad o certidumbre de aquello que recordamos con más facilidad. Para 
mejorar estas estimaciones se puede recurrir al uso de gráficos, en los cuales sobre una escala 
marcamos el grado de certeza que se tiene sobre un hecho dado . 

Una ayuda para llegar a estimar valores numéricos de certeza o probabilidad aproximada es no tratar 
inicialmente de asignar los valores numéricos, sino comenzar por solicitar al experto que ordene los 
hechos o reglas según la certeza que tenga sobre cada hecho o regla , para después calibrar los valores 
numéricos. 

Para el tratamiento a profundidad de métodos numéricos para el manejo de la incertidumbre, se puede 

estudiar la obra de Kruse, Schwecke y Heinsohn, referenciada en la bibliografía del presente 
curso. 

_8. DESARROLLO DE UN SISTEMA 
EXPERTO 


La adopción de la metodología de Sistemas Expertos para atacar un problema debe hacerse después de 
considerar otras alternativas de computación más tradicionales, como lo ilustra el siguiente diagrama : 


1 Egon Brunswik, Leda Cosmides, John Tooby, Gerd Gigerenzer 

2 Ver: "A critique of puré reason", revista The Economist, julio 4 de 1992, pp. 81-82 
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Simplemente con herramienta adecuada ~) 


Como guía para decidir nuestra orientación por sistemas expertos, contamos con los criterios de 
aplicabilidad (vistos en la sección 2.3 ) y con los tipos de aplicación para los cuales han sido más 
adecuados estos sistemas. 


8.1. EQUIPO HUMANO: ROLES Y PERFILES 

En el desarrollo convencional de un sistema experto, exiten los siguientes protagonistas : 

- El Experto 

- Provee el conocimiento del dominio y de la tarea específica. 

- Trata de explicar (verbalizar) sus métodos y conocimientos. 

El experto debe tener estas cualidades: 

- Estar muy familiarizado con su especialidad. 

- Tener experiencia real, adquirida con la práctica através del 

tiempo. 

- Tener excelentes relaciones con quien(es) desarrollará(n) el S.E. 

- Tener conocimientos sobre el ambiente organizacional y los 

usuarios que utilizarán el sistema. 

- Estar dispuesto a dedicar un buen porcentaje de su tiempo al 

desarrollo del S.E. 

- Ser colaborador para trabajo en equipo, y tener deseos de 

trabajar en el proyecto. 

- Tener en su especialidad una reputación tal que si se lograse 

capturar una buena porción de sus conocimientos, las 
conclusiones del sistema tendrían una base de credibilidad. 

- Tener buena capacidad de introspección y de comunicar a otros 

sus conocimientos y las razones de sus juicios, y ser 
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honesto a este respecto. 

- Apreciar los sistemas automatizados. 

- Tener paciencia. 

- Tener capacidad de enseñar. 

- Ser buen comunicador ( escuchar y conversar). 

- Ser persistente. 

- El formalizador o "Ingeniero" del Conocimiento (I.C.) 

- Ayuda al experto en la labor de explicar los conocimientos. 

- Codifica los conocimientos en la representación adecuada a la 

herramienta de desarrollo. 

- Conoce las fortalezas y debilidades de las herramientas y metodologías. 

- Aprende las particularidades de: El dominio, la tarea específica y del 

ambiente donde se utilizará el S.E., a partir de la Administración, 
los expertos y los usuarios. 

- Analiza los procedimientos del experto 

- Detecta inconsistencias. 

- Refina la B.C. por medio de la realización de pruebas. 

El perfil del ingeniero de conocimiento puede ser el correspondiente a: Analista 
de sistemas, ingeniero de sistemas, o sicólogo cognoscitivo. 

Cualidades deseables : 

- Aprender rápidamente 

- Ser buen comunicador 

- Tener buenas relaciones interpersonales 

- Escuchar eficazmente 

- Conocer técnicas de adquisición de conocimientos 

- Conocer la tecnología de los SS.EE. 

- Ser organizado y conservador de información 

- Tener buena capacidad de análisis. 

- Es conveniente que tenga conocimientos de otros dominios. 

- El Usuario 

- Normalmente no es un experto. 

- Puede ser un aprendiz del dominio o, en algunos sistemas, una persona 

cualquiera. 

- La Administración 

- Identifica el problema. 

- Aprueba la realización del proyecto. 

- Asigna los recursos. 


Adicionalmente, a veces se incorpora al grupo de desarrollo un "aprendiz de I.C.", con el objeto de 
formar más personal con entrenamiento en la tecnología, y tener apoyo para el mantenimiento futuro 
del S.E. con alguien que presenció su desarrollo. 


8.2. ADQUISICION DEL CONOCIMIENTO 

Al desarrollar un S.E. no se prescribe "Qué hacer", en el sentido de la programación tradicional, sino 
que se describe "Qué saber". La tarea es: describir, depurar, formalizar y transcribir el 
conocimiento; no escribir y depurar un programa. 

El proceso de adquirir el conocimiento se basa en descubrir los atributos del problema a los cuales el 
experto dedica su atención, y poner de forma explícita las reglas que el experto utiliza para la 
interpretación de esos atributos y para la toma de decisiones. 
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DIFICULTADES EN LA ADQUISICION DE CONOCIMIENTOS 

El proceso de adquirir el conocimiento para un S.E. presenta varias dificultades, por ejemplo : 

A - INADECUACION DE LA REPRESENTACION 

originada en la diferencia entre la manera como un experto expresa 
normalmente sus conocimientos, y la manera como esos conocimientos deben 
representarse en el programa. 

B - LIMITACIONES DE LA ACTUAL TECNOLOGIA DE S.E. Y SUS METODOS DE 
ADQUSICION DE CONOCIMIENTOS. 

Los métodos aún tienen más de arte que de ingeniería, a pesar de hablarse de 
"ingeniería del Conocimiento" 

C - DIFICULTAD PARA EXPRESAR EL CONOCIMIENTO POSEIDO 

porque, como lo expresó el fisiólogo y filósofo del método científico Claude 
Bernard: " Podemos más de lo que sabemos , sabemos más de lo que 
comprendemos, y comprendemos más de lo que podemos explicar " . 



Y precisamente, para codificar los conocimientos del experto necesitamos 
poder explicar sus razones. 

Los expertos frecuentemente no siguen el razonamiento "lineal" que aparece en 
los textos. Ellos tienden a reconocer "patrones" o "configuraciones", lo que 
les posibilita utilizar de manera muy rápida conocimientos compilados através 
de la experiencia, sin necesidad de reflexionar sobre los pasos involucrados 

El conocimiento del experto se almacena "subconscientemente", y esto agrega 
poder al experto, pero al mismo tiempo dificulta esa transferencia de 
conocimientos requerida para implementar una B. C. Un experto puede tener 
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más dificultad que un principiante para explicar sus acciones debido a que 
mucho de lo que hace ya tiene sus razones en el subconsciente. 

Fuera de las anteriores dificultades de índole general, según el tipo de problema, se pueden presentar, 
en general otras dificultades, para las cuales el I.C. debe estar alerta. Veamos algunas de estas 
dificultades según tipo de problema: 

- INTERPRETACION: Análisis de datos para determinar su significado. 

Dificultades típicos: 

- Los datos a menudo poseen ruido y errores. 

- Pueden faltar datos . 

- DIAGNOSTICO : Determinar la falla basándose en la interpretación de los datos. 

Dificultades típicos: 

- Las fallas pueden ser inter mi tentes. 

- Puede haber múltiples fallas, cuyos síntomas pueden interferir. 

- Los datos contienen errores. 

- Hay datos deseables pero inaccesibles. 

- El equipo de medición o dignóstico puede no ser confiable. 

- PREDICCION: Determinación de lo que probablemente ocurrirá . 

Dificultades típicos: 

- Información incompleta. 

- Múltiples escenarios futuros posibles. 

- Contingencias e incertidumbres. 

- Diversidad de datos, a menudo contradictorios. 

- PLANEACION: Crear un plan para conseguir determinados objetivos. 

Dificultades típicos: 

- Muchos cursos de acción alternativos. 

- Excesivo volumen de detalles. 

- Desconocimiento parcial del contexto para el que se planea. 

- DISEÑO: Concebir las especificaciones para crear objetos que satisfagan requerimientos particulares. 

Dificultades típicos: 

- Dificultad para evaluar las consecuencias. 

- Varias restricciones y objetivos contradictorios. 

- Interacción entre sub-diseños. 

8. 3. PROCESO DE CAPTURA Y CODIFICACION DE CONOCIMIENTOS 

El objetivo de desarrollar un S.E. es transferir conocimiento de un experto humano al computador, y 
luego permitir que ese conocimiento sea utilizado por otra(s) persona(s). Este proceso involucra dos 
actividades básicas: 

- Captura del conocimiento a partir del experto. 

- Representación del conocimiento en el computador. 

La etapa de CAPTURA o Adquisición de conocimiento comprende la acumulación, transferencia y 
transformación de la experiencia en solución de problemas al S. E. para construir, depurar o ampliar la 
Base de Conocimientos (B.C.). Las fuentes posibles de conocimientos incluyen, por ejemplo: Los 
expertos humanos, los libros, los manuales, las bases de datos, estudios o informes especiales, y la 
experiencia del propio usuario. 

Se recomienda tener una perspectiva amplia respecto a los recursos a utilizar para la adquisición de 
conocimientos, tanto en cuanto a posibles fuentes de información, como a posibles técnicas o 
metodologías. El evitar sistemáticamente ciertas técnicas tiene la desventaja de que nunca nos 
permitirá desarrollar experiencia de primera mano con esas técnicas . 
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8.3.1. LABORES PREPARATIVAS DE LA ADQUISICION DE CONOCIMIENTOS 

1- ESTABLECIMIENTO DE INSTALACIONES FISICAS 

- Se define la sala para las entrevistas 

- Se define el equipamento (muebles, grabadora, ayudas, etc.) 

2 - PROGRAMACION DE LA ADQUISICION DE CONOCIMIENTOS 

- Se definen los procedimientos de conservación de la información. 

- Se definen las técnicas que se utilizarán con el experto. 

- Se definen los procedimientos de revisión 

- Se definen los roles de los participantes 

3 - ORIENTACION DEL EXPERTO 

- Se orienta y se motiva al experto para las tareas a realizar 

SALA DE SESION O DE ENTREVISTAS 

Para el lugar donde se realiza el proceso, se recomienda lo siguiente : 

- Capacidad mínima de tres personas. 

- Mesa y sillas. 

- Grabadora o videocámara, ojalá camufladas. 

- Sin telefono, para evitar distracciones. 

- Aislamiento de otros distractores (Ej: ruido) 


MOTIVACION DEL EXPERTO 

Un mecanismo para mejorar la colaboración del experto es involucrarlo en el proyecto desde la primera 
etapa del desarrollo. El hecho de que el experto trabaje participe en la evolución del concepto y la 
concepción del sistema sirve para darle a él un sentido de pertenencia. En lo posible se debe 
desarrollar rápidamente un prototipo funcional para probarlo con el experto. 


8.3.2. ETAPAS Y METODOLOGIAS PARA LA ADQUISICION DE CONOCIMIENTOS 

La Adquisición del Conocimiento es el proceso por el cual los desarrolladores de SS.EE. encuentran 
los conoci mi entos que los expertos utilizan para desarrollar la tarea de interés. Estos conocimientos 
son luego representados internamente en el computador para que el S.E. los utilice. 

Dado que el conocimiento es la parte escencial de un S.E., entonces la Adquisición del Conocimiento 
es la tarea más importante en el desarrollo de un S.E. 

La técnicas que se utilizan deben ser adaptadas por los desarrolladores, según la situación particular. 

Adquirir el conocimiento es una tarea compleja, que crea un "cuello de botella" durante la construcción 
de un S. E. El actual "estado del arte" requiere que el formalizador (ingeniero) del conocimiento 
(I.C.) interactúe con uno o más expertos para construir la B.C. 

Los conocimientos que hay que representar en el S.E., se presentan bajo diversas formas, como lo 
ilustra el gráfico siguiente. 


DIFERENTES CLASES DE CONOCIMIENTO APORTADOS POR EL EXPERTO 
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El proceso de adquirir el conocimiento para un S. E. tiene similitud con un proceso de destilación , 
porque se deben aislar los conoci mi entos esenciales, separándolos de otra información que no es tan 
significativa , para luego formularlos como hechos y reglas . 


Normalmente, el I.C. ayuda al experto a estructurar el dominio del problema y su solución, 
recurriendo a varias acciones : 

- Interpretando las respuestas a preguntas. 

- Integrando las respuestas y otros conocimientos. 

- Proponiendo analogías. 

- Proponiendo antiejemplos. 

- "Poniendo sobre el tapete" dificultades conceptuales. 

La tarea de codificar el conocimiento no consiste en una sencilla tarea de "agregar reglas", pues en este 
proceso pueden ocurrir cosas como : 

- Encadenamiento de reglas sin-fin 

- Introducción de contradicción entre reglas. 

- Necesidad de modificar reglas existentes. 


Los siguientes 3 gráficos ilustran a grandes rasgos las etapas de la adquisición de conocimientos por 
parte del I.C. 
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FASE 1 



- Terminología del dominio 

- Información de tipo general 

- Conceptos importantes 


- Identificar relaciones entre objetos y hechos 

- Identificar funcionamientos 


- Identificar módulos. 

- Identificar entradas y salidas 

- Determinar tipos de conocimiento 

- Elaborar planes para la adqusición de 
conocimientos 


Se estima que durante esta FASE 1 , un 80 % depende del Ingeniero del Conocimiento, y tan sólo un 20% del experto. 
La primera etapa de esta fase incluye la familiarización con el dominio, de parte del ingeniero del conocimiento, para lo 
cual se realiza básicamente lo siguiente : Se conviene en mantener una información centralizada. Se elabora un glosario 
con los términos del dominio. Se intercambian conocimientos entre los miembros de grupo 


FASE 2 



- Planear la sesión 

- Desarrollar un repertorio de problemas 

- Utilizar técnicas de entrevista 

- Utilizar análisis de protocolos 

- Observar comportamientos del experto 

- Inducir reglas 


- Desarrollar grafos de conocimientos 

- Desarrollar pseudocódigo 

- Revisar las notas y grabación de la sesión 


- Planear la sesión 

- Utilizar entrevistas estructuradas 

- Utilizar simulaciones 

- Desarrollar prototipos 
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En las etapas de la Fase 2 , la participación del I.C. y la del experto deben ser aproximadamente 
equilibradas, cada uno 50% . 


FASE 3 



- Representar los conocimientos 

- Hacer refinamientos continuamente 


- Desarrollar escenarios de prueba 

- Hacer pruebas con varios expertos 

- Revisar con ayuda de seguimientos ("tracing") 


Durante esta tercera Fase de la adqusición de conocimientos, el I.C. vuelve a tener una particiapación 
del orden de 80%, mientras que la del experto es de un 20%. 


El proceso se puede discriminar en las siguientes etapas, obteniéndose los productos indicados, y 
haciendo una evaluación después de cada etapa : 


ETAPA 

PRODUCTO 

A - ANALISIS DE LA SOLICITUD DEL CLIENTE Definición de objetivos funcionales 

B - ENTREVISTAS NO ESTRUCTURADAS 

Conocimientos fundamentales 

C - ANALISIS CONCEPTUAL 

Estmctura de la Base de Conocimientos 

D - ANALISIS DEL DOMINIO 

Relaciones de los conocimientos 

E - ANALISIS DE LA SOLUCIONES 

Estrategias y reglas de solución 

F - ENTREVISTAS ESTRUCTURADAS 

Datos específicos 

G - PROTOTIPO 

Simulaciones , pruebas 


EVALUACION DE LOS OBJETIVOS DE CADA ETAPA 

Después de cada etapa se hace una evaluación acerca de si se han logrado los objetivos de la etapa, en 
caso afirmativo se procede a la etapa siguiente, en caso negativo habrá que retomar a alguna etapa 
anterior, como se indica, según la deficiencia detectada : 
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PROBLEMA 

ETAPA A REPASAR 

Resultados incompletos 

Prototipo 

Falta de claridad 

Entrevistas estructuradas 

Descripción inadecuada de la solución 

Análisis de soluciones 

Organización inadecuada del dominio 

Análisi del dominio 

Estructura del dominio inapropiada 

Análisis conceptual 

Conocimientos fundamentales incompletos 

Entrevista no estructurada 

Otro 

Replanteamiento de especificaciones del problema 


8 . 3. 3. LA SESION DE ADQUISICION DE CONOCIMIENTOS 
Cada sesión de adquisición de conocimientos se compone de : 

- Planeación de la sesión, en la que se debe invertir del orden de 40% del tiempo. 

- Ejecución de la sesión, a la cual se dedica del orden de 15% del tiempo. 

- Revisión de la sesión, la cual requiere un 45% del tiempo 


El liderazgo del ingeniero del conocimiento para conducir la sesión, según su nivel de control de las 
actividades, podría ir desde la total libertad hasta la autocracia, siendo ambos extremos inadecuados. 
Se debe trabajar con cierto nivel de democracia, pero con una supervisión que asegure que la sesión no 
se desvia de los objetivos para los cuales se planeó. 


NIVELES DE CONTROL DE LA SESION DE PARTE DEL INGENIERO DEL CONOCIMIENTO 


IVEL DE 


CON' 


ROL 




TOTALMENTE LIBRE 

PERMISIVO 

DEMOCRATICO 

SUPERVIS0RI0 

AUTORITARIO 

AUT0CRATIC0 


liderazgo adecuado 
para las sesiones 


La sesión de adquisición de conocimientos, propiamente dicha, tiene las siguientes etapas: 
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1 - INTRODUCCION: 

- Resumen de la sesión anterior si la hubo. 

- Presentación de la actual sesión (objetivo, técnicas, duración aproximada, etc.) 

2 - ADQUISICION DE CONOCIMIENTOS APLICANDO LAS TECNICAS 
SELECCIONADAS 

3 - CONCLUSION: 

- Resumen de la sesión 

- Repaso de los hallazgos 

- Solicitudes de aclaración 

- Solicitudes de extensión 

- Expresión de agradecimiento hacia el experto 

- Información sobre qué seguirá en la próxima sesión 
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Después de la sesión se elaboran unos documentos o Formas que son de vital importancia, tanto para 
el desarrollo en sí del sistema, como para posteriores labores de seguimiento . En esta página y las 
siguientes se dan ejemplos de Formas para la sesión, las reglas y las tareas desarrolladas por el 
experto. 

El siguiente es un modelo de Forma de Sesión, la cual resume lo más importante de la sesión: 


FORMA DE SESION 


Sistema: Módulo : 

Sesión: Lugar: 

Fecha: Horas : 

Experto: 

Ingeniero(s): 


Tipo de sesión: entrevista seguimiento de proceso revisión simulación 

Otro: 


Objetivo principal: 







Resumen de la sesión : 














Identificación de reglas derivadas: 






Identificación de documentación anexa : Video notas págs Cassette 

Otra: 


Aprobado por: 


FORMA DE REGLA 
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Sistema: Módulo : 

Nombre de la regla : 

Fuente : 

Sesión: Contexto : 


Contenido : 
















Nota sobre certeza : 



Excepciones o casos especiales : 








Otros comentarios : 







Aprobada por : 
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Esta Forma se puede utilizar para organizar la información acerca de las acciones que desarrolla el 
experto : 
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Las siguientes son recomendaciones prácticas para las sesiones de adquisición de conocimientos : 

1 - Procure que la sesión no se desvíe de los objetivos. Si surge algo importante pero no pertinente, 
mejor programe su exámen para otra sesión. 

2- Se debe comenzar por la adquisición de conocimientos de base sobre el dominio y la tarea. Por 
medio de la documentación escrita (libros, manuales, etc...) y de charlas tutoriales del experto, 
el (o los) ingeniero(s) del conocimiento se capacitan y familiarizan con el dominio o 
especialidad y con la tarea específica que realiza el experto y deberá realizar el nuevo S. E. 
Inicialmente serán conocimientos generales sobre conceptos, terminología y modelos utilizados 
en el dominio, sin concentrarse todavía en la tarea específica. 

3 - Es útil preparar un documento tutorial o instructivo sobre el dominio, en caso de que no esté 

disponible uno equivalente. Este es útil tanto en el período inicial de desarrollo, como para 
capacitar personal que se una al proyecto más tarde, o que deberá encargarse del mantenimiento . 

4 - A veces, las primera semilla de la B. C. se puede formar a partir de la documentación escrita 

disponible (libros, manuales, etc...) . 


CICLO DE ADQUISICION Y PRUEBA 

El ciclo consiste en : Evocar conocimientos, documentarlos y probarlos . Si se tiene una báse de 
conocimientos pequeña, se puede hacer una "simulación manual" del proceso de razonamiento : 



A partir de cierto momento se deben hacer las pruebas directamente con el prototipo, para lo cual es 
necesario implementar los conocimientos en dicho prototipo : 
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Para expadir la Base de Conocimientos inicial, el S. E. en desarrollo se debe enfentar a un número 
cada vez mayor de casos , verificando constantemente que el sistema es capaz de resolver 
satisfactoriamente esos casos . Una técnica que se puede usar es modificar los casos de prueba 
iniciales para generar variantes que se someten al S.E. Una variante puede consistir en alterar el valor 
de un parámetro del problema, llevándolo hacia uno de sus extremos, o en suponer que no se 
dispone de cierta información. 

Con base en todos los puntos de desacuerdo con el experto, se debe modificar y expandir la B. C. 
hasta que el sistema esté en capacidad de razonar correctamente frente a todos los casos de prueba y 
sus variantes . 

La documentación del sistema en desarrollo debe mantenerse actualizada continuamente ( por ejemplo 
diariamente ), y todo el grupo de desarrollo debe recibir la ultima versión de la documentación. 

A veces hay conceptos imprecisos, como : " suficiente cantidad ", "una gran cantidad ", que el experto 
tiene dificultad en determinar numéricamente, al menos inicialmente . En este caso puede ser mejor no 
forzar al experto a mayor precisión en ese momento. Posteriormente se puede volver sobre esos 
conocimientos para determinar cuanto es "suficiente", o "gran cantidad" 


RECOMENDACIONES PARA LA TOMA DE NOTAS 

1 - Antes de la entrevista informe al experto que Ud. tomará notas, y cómo piensa utilizarlas. 

Hágale llegar al experto el "plan de adquisición de conocimientos". 

2 - Equípese con suficientes utensilios para tomar nota. 

3 - No esconda las anotaciones de la mirada del experto . 

4 - Referencie las notas a las secciones correspondientes de la entrevista para facilitar la revisión y 

la depuración. 

5 - Revise las notas pronto. Ojalá dentro de las 48 horas siguientes a la sesión. 

6 - Documente el conocimiento usando reglas en "cuasi-español" , para aislar bloques de 

conocimiento de una manera fácil de entender para todos los miembros del grupo. 
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7 - Desarrolle y utilice convenciones que ayuden a la claridad de los conocimientos documentados, 

por ejemplo : Uso de mayúscaulas, sangrías, etc... 

8 - Agrupe las reglas documentadas con cierta lógica , para una ágil búsqueda. 

9 - Se recomienda bautizar cada regla con un nombre descriptivo, a pesar de que resulte un 

tanto largo, pues el uso exclusivo de numeración es inconveniente por lo cambiante que es el 
conjunto de reglas, en especial durante el desarrollo, lo cual obligaría a renumerar continuamente 
el conjunto. 

10 - Se recomienda adicionar a cada regla, en la documentación, información sobre el porqué se 

incluye, o el contexto en el que se utiliza. Esto es de gran utilidad con posterioridad para el 
mantenimiento del sistema 


RECOMENDACIONES PARA LAS GRABACIONES DE AUDIO O VIDEO 

1 - Asegúrese de saber manejar el equipo. 

2 - Al enviar al experto el plan para la(s) sesión(es), infórmele si se grabará. 

3 - Explique al experto porqué le gustaría grabar y cómo utilizará la grabación. 

4 - Antes de la sesión, verifique que el equipo y su fuente de energía funcionan bién y tiene cinta 

suficiente. 

5 - Verifique la sensibilidad al sonido o a la luz de la escena. Instale el equipo antes de la sesión. 

6 - Para reducir la distracción, coloque los micrófono o la cámara ocultos o camuflados. 

7 - Si el experto se opone a dejar grabado algo, apague el equipo. 

8 - Apoye la grabación con anotaciones. 

9 - Identifique cada cinta con referencia a la sesión en que se obtuvo. 

Las principales técnicas usadas para la adqusición de conocimientos son: Las Entrevistas, El Análisis 
de protocolos, La Observación , y la Inducción de reglas . 


ENTREVISTAS 

La forma más utilizada de adqusición de conocimientos se basa en hablar directamente con el experto, 
en una serie de entrevistas. Las entrevistas usualmente involucran al experto y a uno o dos I.C. El 
experto piensa en voz alta mientras el I.C. trata de entender como aquel razona, toma decisiones y 
llega a una conclusión. 

La entrevista procura crear un contexto ( por ejemplo la solución de un caso ) en el cual el experto 
haga una exploración y explicación de sus conocimientos , y aportar medios para registrar esos 
conocimientos. 

Para asegurar la exactitud de las observaciones, se recomienda grabar las entrevistas, luego 
transcribirlas, y hacerlas verificar por el experto . 

Durante las entrevistas procure : 

1 - Mantener la atención y el contacto visual con el experto. 

2 - Crear un ambiente de amistad, haga que el experto se sienta confortable. 

La adquisición se puede iniciar pidiéndole al experto que tome un caso de prueba y realice la tarea paso 
a paso, tratando de explicar en detalle cada decisión . Para mayor facilidad del experto, esta etapa 
puede apoyarse en un grabación , cuando el hecho de solamente tomar notas incomoda al experto por 
la lentitud que le implica esa copia por parte del ingeniero . 

A menudo una decisión breve del experto, realmente involucra mucha información que debe 
implementarse dentro del computador. 
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PREGUNTAS ABIERTAS Y CERRADAS 

Las preguntas cerradas son las que en cierta medida delimitan las opciones de respuesta que se le 
dejan al experto, por ejemplo, preguntas que se encabezan por palabras interrogativas como : 

Quien . .. ? Qué . .. ? Cuándo . . . ? Dónde . . . ? 


Las preguntas abiertas son aquellas que no li mitan las opciones de respuesta, sino que buscan una 
respuesta más libre, una explicación, por ejemplo las encabezadas por : 

Discuta . . . Interprete . . . Explique . . . 

Evalúe . . . Compare . . . Que pasa si ... ? 


EJEMPLOS DE PREGUNTAS ABIERTAS 
CERRADAS 

- Cómo funciona el sistema_ ? 

- Qué necesita Ud. saber antes de poder decidir ? 

- Porque escogió_en lugar de_? 

- Qué Conoce Ud. acerca del sistema _ ? 

- Cual es su reacción general ante la afirmación 

de que _ ? 


EJEMPLOS DE PREGUNTAS 

- Cual de estos planes considera Ud ? 

- Cuales tipos de_considera Ud. más ? 

- Hará esto que_aumente o disminuya ? 

- Cual es la magntud deseada para este parámetro ? 


TECNICAS PARA EVOCAR LOS CONCEPTOS DEL DOMINIO 

- Solicitar definiciones: Para comprender las relaciones entre conceptos. 

- Comparar tareas y casos : Ayuda para aislar rasgos importantes de los conceptos. 

- Ejercicios de generalización : Ayuda a buscar conceptos primarios. 

- Ejercicios de predicción: Trata de ver las consecuencias de situaciones o acciones. 

TIPOS DE ENTREVISTAS PARA ADQUISICION DE CONOCIMIENTOS 

1 - Entrevista sobre clasificación. 

2 - Entrevista sobre un caso específico. 

3 - Entrevista dirigida. 

4 - Discusión de casos auxiliada con prototipo del sistema 
ENTREVISTAS DE CLASIFICACION 

Con este tipo de entrevista , el I. C. busca conseguir una visión del modelo mental que posee el 
experto sobre el dominio del problema . Para entrevistas de este tipo se pueden usar técnicas de 
sicología para evocar esta clase de conocimientos. Una de tales técnicas es utilizar las "Matrices de 
Repertorio " (ingl.: "Repertory Grids") . 

Matrices de Repertorio 

Las Matrices de Conceptos (inglés: "Repertory Grids") son una técnica originada por George Kelly 
en 1955 para adquirir conocimientos sobre las construcciones mentales personales (ing.: "personal 
constructs") de sus pacientes . Desde el decenio de 1980 , B.R. Gaines y M. L. G. Shaw 
comenzaron la adaptación de esta técnica a la adquisición de conocimientos a partir de expertos. 

El tipo de caso que el experto resuelve se caracteriza por un conjunto de atributos, y cada caso 
particular posee ciertos valores determinados para esos atributos, a estos valores los denominaremos 
características del caso. 
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Por ejemplo, para el problema de aconsejar sobre inversiones, podemos considerar las siguientes 
características de cada caso 


ATRIBUTO 

CARACTERISTICA 

OPUESTO 

DEL CASO 

DEL CASO 


Plazo del objetivo de inversión 

Largo 

Corto 

Actidud frente al riesgo 

Aversión 

Propensión 

Nivel de capital 

Alto 

Bajo 


CARACTERISTICAS DE LOS CASOS 


^atributos 

CAS0S\ 

Plazo del 
objetivo de 
inversión 

Actitud 

frente al 
riesgo 

nivel de 
capital 

María 

OBJETIVO 

DE INVERSION 

A LARGO PLAZO 

TIENE 

AVERSION 

AL RIESGO 

ALTO 

Juan 

OBJETIVO 

DE INVERSION 

A CORTO PLAZO 

TIENE 

AVERSION 

AL RIESGO 

MEDIO 

David 

OBJETIVO 

DE INVERSION 

A LARGO PLAZO 

TOMADOR 

DE RIESGOS 

MEDIO 


La tarea del experto consiste en hacer una selección definida entre varias alternativas. Cada selección 
posible posee un conjunto de atributos, y la selección específica que escoja el experto posee por lo 
tanto ciertos valores determinados para esos atributos, a estos valores los denominaremos 
propiedades de la selección. 


Por ejemplo, para el problema de aconsejar sobre inversiones, podemos considerar las siguientes 
propiedades de cada selección. 


ATRIBUTO DE LA 

PROPIEDADES 

OPUESTO 

SELECCION 

DE LA SELECCION 


Tributación 

Impuestos 

Exención de impuestos 

Plazo de Inversión 

Largo 

Corto 

Nivel de Riesgo 

Alto 

Bajo 

Capital requerido 

Alto 

Bajo 






Curso Básico de Sistemas Expertos 


7 1 


PROPIEDADES DE LAS SELECCIONES 


V ATRIBUTOS 

SELECCIONES^^ 

Tributación 

Plazo de 
inversión 

Nivel 

de 

riesgo 

Bienes 

Raíces 

impuestos 

largo 

plazo 

bajo 

Acciones 

Exención de 
impuestos 

corto 

plazo 

alto 

Certificados 

Exención de 

corto 

bajo 

de Depósito 

impuestos 

plazo 


Tanto las características de los casos, como las propiedades de las selecciones se pueden representar 
por medio de matrices como los siguientes, las cuales dan la posibilidad de asignar valores de 
pertenencia o factores de certeza que indiquen en qué grado cada caso posee cada característica, y en 
que grado cada selección posee cada propiedad : 


Comparando casos de ejemplo se pueden identificar las características importantes en el dominio, y 
comparándo las diferentes selecciones que puede hacer el experto se identifican las propiedades de 
dichas selecciones . 

ENTREVISTA SOBRE UN CASO ESPECIFICO 

Se le presenta al experto un problema realista de la clase que se espera que el S. E. resolverá . Se le 
pide al experto que le hable al ingeniero del conocimiento mientras resuleve el caso. En una variante 
de este método, se comienza sin información para el experto, el cual debe solicitar explícitamente la 
información que va necesitando ; al hacer esto, se hace más evidente la "navegación" del experto 
através del dominio, en especial en cuanto a las entradas que requerirá el S.E. 



CARACTERISTICAS 


C 

A 

S 

\ 

OBJETIVO DE 
INVERSION A 
LARGO PLAZO 

AVERSO 

AL 

RIESGO 

RICO 

MARIA 

0.9 

0.B 

0.9 

0 

S 

JUAN 

0.2 

0.9 

0.5 


DAVID 

0.7 

0.3 

0.6 




PROPIEDADES 



\ PAGA 

A 

DE 

DE 


\ IMPUESTOS 

LARGO 

ALTO 

MUCHO 


\ 


PLAZO 

RIESGO 

CAPITAL 

C 

C 

i 

BIENES 

RAICES 

0.9 

0.B 

0.2 

0.8 

1 

□ 

N 

ACCIONES 

0.2 

0.3 

0.8 

0.5 








C.D.T. 

0.2 

0.3 

0.2 

0.5 
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El siguiente es un ejemplo de diálogo en una entrevista para adquisición de conocimiento en el dominio 

: "ayuda a usuarios del paquete estadístico SAS " : 

Experto : - Ayer hablé con un usuario novato. No podía comenzar porque no entendía el paso DATA . 
Ese siempre es un primer paso , bueno, casi siempre, y la gente a menudo lo olvida . 

I. C. : - Que necesitaba ese usuario en el paso DATA ? 

Experto : - Bueno, necesitaba uno que le faltaba. Hay unas cinco clases diferentes de pasos DATA . 

Le recomendé una entrada sencilla de campos fijos, y le sugerí que pusiera los datos en el 
mismo archivo, en vez de ponerlos en un archivo separado. Así se reduce la complejidad 
del J C L . 

I.C. : - JCL ? 

Experto : - J C L o "Job Control Language" , es un conjunto de instrucciones para manejar 
principalmente archivos . Si los datos están en otra parte, se debe preparar una línea de J 
C L que diga dónde está el archivo de datos, y cómo está formateado. 

I. C. : - Necesitaremos hablar más sobre el JCL , pero por ahora, volvamos al usuario de 

ayer y su necesidad de un paso DATA . Porqué le sugirió un paso DATA de formato fijo 
? 

Experto : - Sobre todo porque sus datos eran simples , y el formato fijo requiere que él organice bien 
sus datos en filas y columnas. Un formato libre les parece más fácil a los nuevos 
usuarios, pero hay más posibilidad de error, y es difícil encontrar errores en datos de 
formato libre . 

I. C. : - Cuando Ud. dice que los datos eran simples, qué significa eso ? 

Experto : - Había menos de 100 registros, y sólo unas 15 variables. Tampoco había datos faltantes, y 
los casos no eran complejos. La semana pasada vino uno que no podía decidir como serían 
sus registros : Tenía datos de un montón de gente en varios salones de clase y en escuelas. 
Quería estudiar diferencias entre escuelas. Esos no eran unos datos simples . 


Así entrevistando al experto, el I.C. lentamente construye una representación de los conocimientos del 
experto . 

El proceso de adquisición implica descubrir los atributos del problema que interesan al experto ( en el 
ejemplo: paso DATA, formato fijo ) , y hacer explícito el proceso de pensamiento, usualmente 
expresado como reglas empíricas , que el experto usa para interpretar esos atributos. 

Utilizando la terminología vista en las Matrices de Repertorio, los criterios de decisión se basan en 
asociar las características del caso con las propiedades de la selección . En el ejemplo visto sobre 
inversiones de dinero, hay correspondencias muy evidentes y directas, por ejemplo entre la 
característica "aversión al riesgo" de un caso y la propiedad "inversión de bajo riesgo", pero en general 
en todas las situaciones la correspondencia no es tan sencilla, sino que se da entre un conjunto de 
características y un conjunto de propiedades. 


Para identificar las reglas simples aplicadas por el experto, debemos averiguarle : 

- Comparando dos selecciones: Para un caso específico, por cual propiedad, 

escogió una selección y no otra . 

- Comparando dos casos: Por cuál característica del caso esgogió una selección 

determinada para ese caso y no para el otro . 

Para identificar las reglas de varias condiciones : 

- Comparando dos selecciones que tienen una propiedad común : Para un caso 

específico, por cual otra propiedad, escogió una selección y no la otra. 
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Para relacionar características de los casos con propiedades de las selecciones : 

- Para un caso específico, cual o cuales característica(s) del caso se relacionan 
directamente con cual o cuales propiedades de la selección escogida para ese 
caso . 


Este tipo de preguntas se pueden automatizar en cierta medida, para lograr cierto grado de inducción 
automática de reglas, como se verá en la sección siguiente. 


Algunas entrevistas se pueden enfocar a casos excepcionales o difíciles , ya que estos son valiosos 
para obtener buena información sobre los conocimientos puestos enjuego por el experto. 


CLASIFICACION DE TECNICAS DE ANALISIS DE CASOS 


CASO 

RESTRICCION 

DESCRIPCION 

VENTAJAS 

DESVENTAJAS 


NINGUNA 

EL EXPERTO 

REALIZA 

UNA TAREA QUE 
RUTINARIAMENTE 
RESUELVE 

EL EXPERTO 

SE SIENTE 

COMODO 

PUEDE SER MENOS 
PRODUCTIVA POR 
UNIDAD DE TIEMPO 

FAMILIAR 

DATOS 

FALTANTES 

AL EXPERTO SE LE 
PRIVA DE CIERTA 
INFORMACION QUE 
NORMALMENTE SI 
ESTA DISPONIBLE 

PUEDE DISEÑARSE PARA 
EXTRAER INFORMACION 
SOBRE SUBDOMINIOS 
SELECCIONADOS DEL 
CONOCIMIENTO 

EL EXPERTO 

NO ESTA COMODO. 

PUEDE NEGARSE 

A EMITIR JUICIOS. 

PUEDE TOMAR EL 


PLAZO 

LIMITADO 

EL EXPERTO DEBE 
EJECUTAR LA 
TAREA DENTRO DE 
UN LIMITE DE 
TIEMPO FIJADO 

PUEDE DAR 
INFORMACION 

SOBRE ESTRATEGIAS 
DEL EXPERTO 

PROCEDIMIENTO COMO 

SI FUERA UN DESAFIO 
PARA VER CUAN LISTO ES; 

ESTA PERCEPCION DEBE 
EVITARSE INDICANDOLE LA 
FINALIDAD DE LA TECNICA. 

DIFICIL 

NINGUNA 

EL EXPERTO HACE 

LA TAREA SOBRE 
UNOS DATOS QUE 
REPRESENTAN UN 
CASO DIFICIL 

EN ETAPAS AVANZADAS 
DE ADQUISICION, DA 
INFORMACION SOBRE 
ASPECTOS SUTILES, 
EXCEPCIONES Y LIMITES 
DE LAS REGLAS 

PUEDEN PRESENTARSE 
IMPREDECIBLEMENTE, 
CUANDO EL I.C. NO ESTA 
PRESENTE. EL MISMO 
EXPERTO DEBE REGISTRAR. 


8.3.4. INDUCCION AUTOMATICA DE REGLAS 

Como resultado de las investigaciones sobre sistemas discentes o aprendizaje de la máquina ( ingl.: 
"machine leaming") , se han desarrollado algoritmos que, dado un conjunto de casos, cada uno 
compuesto de datos (ej: valores de atributos tenidos en cuenta para una conclusión), y conclusión la 
regla que se está aplicando en esos casos. 
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La inducción de reglas también se trata en la literatura como "inducción de árboles de decisión", ya que 
la decisión se puede representar como la selección consecutiva de ramas de un árbol, donde en cada 
nodo (representante de un atributo) decidimos por cual rama seguir, según el valor del atributo. 

Algunas herramientas para desarrollo de SS. EE. tienen capacidad de inducir reglas. 

Un sistema puede generar las preguntas del tipo descrito en la sección anterior, para que se llenen los 
espacios con las respuestas del experto, ejemplos: 

1 - Para identificar propiedades de una selección : 

- Para MARIA seleccioné BIENES RAICES y no ACCIONES 

porque BIENES RAICES es_/ tiene_/_ 

respuesta : EXENCION DE IMPUESTOS 

2 - Para identificar características de un caso : 

- Seleccioné BIENES RAICES para MARIA pero no para JUAN 

porque MARIA es_/ Tiene_/_, 

pero JUAN no es_/ tiene_/_ 

respuesta : OBJETIVO DE INVERSION A LARGO PLAZO 

3 - Para identificar características opuestas : 

- El opuesto de la característica OBJETIVO DE INVERSION A LATGO PLAZO 

es_ 

respuesta : OBJETIVO DE INVERSION A CORTO PLAZO 

4 - Para identificar reglas con varias condiciones : 

- Tanto ACCIONES como C.D.T. son _ / tienen_/_A CORTO PLAZO , 

pero para JUAN seleccioné C.D.T. 

porque C.D.T. es_/ Tiene_/_ 

pero ACCIONES no es_/no tiene_/_ 

respuesta : DE BAJO RIESGO 
De aquí se puede inducir la regla : 

- La inversión es C.D.T. SI la inversión debe ser A CORTO PLAZO 

y la inversión debe ser DE BAJO RIESGO 

5 - Para relacionar características del caso con propiedades de la selección : 

- Para DAVID seleccioné ACCIONES 

porque ACCIONES es_/Tiene_/_DE ALTO RIESGO 

y DAVID es_/Tiene_/_ 

respuesta : PROPENSO AL RIESGO 

Uno de los algoritmos más usados para inducir reglas es el denominado ID 3, propuesto por J. Ross 
Quinlan en 1979 (basado en trabajos de E. B. Hunt de 1966). 


Ejercicio 
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Basándose en el siguiente segmento de diálogo entre un experto (Ex) y Ud. como ingeniero del conocimiento (IC), qué reglas 
tentativas puede Ud. formular para comenzar a desarrollar un prototipo de sistema experto que recomiende qué hacer para 
obtener fotos de buen color ? 

IC- Qué problemas se pueden presentar con la iluminación y el tipo de película ? 

Ex- Cuando se combinan diferentes tipos de iluminación y de película a color, se 
presentan tintes 

indeseables en las fotos. 

I.C- Cuáles, por ejemplo ? 

Ex- Se da un tinte amarillento cuando se usa pelicula para luz diurna con luz 
incandescente o 
photoflood. 

IC- Hay otros casos que originen también tinte amarillento ? 

Ex- Ah ! ... También ocurre cuando se usa película tipo A con lámparas de estudio. 

IC- Qué recomienda Ud. para eliminar el problema y obtener buenos colores ? 

Ex- Bueno, depende : Para película de luz diurna, con luz incandescente recomiendo 
utilizar un 

filtro 80A , y con luz photoflood se debe usar un filtro 80B. 

IC- En el otro caso, el de película tipo A y lámpara de estudio, cual de esos filtros 
recomienda Ud. ? 

Ex- Oh, no; en ese caso es mejor utilizar un filtro 82A . 

IC- Fuera de la coloración amarillenta, cuáles problemas similares se pueden 
presentar ? 

Ex- Bueno, se pueden presentar tintes azul y verdeazul. 

IC- En cuales casos se da eso ? 

Ex- Resulta coloración azul al utilizar película tipo A o tipo B con luz diurna. 

IC- Qué recomienda Ud. en esos casos ? 

Ex- En el caso de película tipo A, recomiendo un filtro 85, y en el caso de película 
tipo B recomiendo un filtro 85B. 

IC- Aja !, bien. Habrá otros casos ? 

Ex- Déjeme pensar, . . . Ah, la película tipo B también presenta ese problema 
cuando se usa con 

lámparas photoflood, pero en este caso basta con un filtro 81 A. 

IC- Bien, todo eso está claro. Ah . . . Ud. mencionó coloración verdeazul, es otro 
caso ? 

Ex- Ah, si. Eso se presenta al utilizar luz de lámparas fluorescentes con película 
para luz diurna o 

con película tipo B. En el primer caso se debe utilizar un filtro FL-D, y en el 
segundo caso un 
filtro FL-B. 
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8.4. VERIFICACION Y VALIDACION DE SISTEMAS EXPERTOS 

Debemos verificar que el sistema está correctamente construido y que efectivamente es el producto que 
satisface los requerimientos . Verificar y validar una Base de conocimientos es una labor ardua, para 
la cual se están desarrollando algunas ayudas automáticas, que en ciera medida pueden al menos 
indicar donde puede haber problemas , para que el Ingeniero del Conocimiento revise esa parte de la 
B.C. y evalúe si efectivamente hay error. 


esfuerzos de 
desarrollo 


revisar 

refinar 



sistema 

validado 

- y 

varificado 


Luego de las etapas de verificación y validación continúan las pruebas , hasta considerar que una de 
ellas es la "prueba final" para aprobar el sistema "oficialmente" . 


PROBLEMAS POTENCIALES CON LAS REGLAS 


1 - REGLAS REDUNDANTES 

Dos reglas son redundantes si ambas se activan en la misma situación y tienen la(s) misma(s) 
conclusion(es) . Este caso es más difícil de detectar cuando en las premisas se manejan 
variables, que aunque tengan nombres diferentes, durante la ejecución pueden tener asignado 
el mismo valor y así hacer equivalentes la reglas. 

La redundancia en una B. C. puede no causar problemas lógicos, pero puede afectar la 
eficiencia . También origina problemas cuando una de las reglas se modifica o suprime y la 
otra se deja tal cual. 


2 - REGLAS EN CONFLICTO 

Dos reglas están en conflicto si se activan en la misma situación, pero arrojan conclusiones 
mutuamente excluyentes . En la notación formal del cálculo de predicados serían : 


Regla A: P(x) ===> Q(x) 
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Regla B : P(x) ===> -> Q(x) 

cuando las conclusiones son diferentes , pero no contradictorias , puede no haber problema 
si esas conclusiones son valores de atributos multivaluados ( que pueden tomar varios 
valores simultáneamente) , por ejemplo: una persona puede tener varias alergias o 
infecciones simultáneamente . 


3 - REGLA INCLUIDA EN OTRA 

Una regla A está incluida en otra regla B, cuando ambas tienen la misma conclusión, pero las 
premisas de B son un subconjunto de las de A . 

Regla A : P(x) y Q(y) ===> R(z) 

Regla B : P(x) ===> R(z) 

si la regla menos restrictiva se cumple, la que tiene más condiciones también, y resulta 
redundante . 


4 - CONDICIONES INNECESARIAS 

Dos reglas contienen condiciones innecesarias si se cumplen los siguientes hechos : 

1) Tienen las mismas conclusiones . 

2) Una condición de una de las reglas está en conflicto con una condición de la otra 

regla , y 

3) Las demás condiciones de las dos reglas son equivalentes . 

En la notación formal del cálculo de predicados serían : 

Regla A : P(x) y Q(y) ===> R(z) 

Regla B : P(x) y -> Q(y) ===> R(z) 

Las condiciones referentes a Q(y) son innecesarias, y solo se requiere una regla : 

P(x) ===> R(z) 

Una variante de esto es cuando la regla B es simplemente : -> Q(y) ===> R(z) 

En este caso la regla A se puede simplificar a : P(x) ===> R(z) 

pero se requieren ambas reglas. 


5 - REGLAS CIRCULARES 

Un conjunto de reglas es "circular" si se pueden encadenar de forma que formen un ciclo 
repetitivo sin fin . 


6 - REGLAS FALTANTES 


Los siguientes cuatro casos pueden indicar que faltan reglas : 
1- Valores de atributo no referenciados en las reglas. 
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2- Valores de atributo ilegales referenciados en alguna regla. 

3- Conclusiones u Objetivo (inglés: "goal") inalcanzables, (que no se le puede 

preguntar al usuario, y cuya regla no se puede encadenar) 


7 - REGLAS QUE NUNCA SE PUEDEN SATISFACER 
Hay varios causas, por ejemplo : 

A) Cuando en la premisa tiene condiciones que son contradictorias y por lo tanto siempre 
se evalúa como falsa, ej: 

Regla A : P(x) y Q(y) ===> R(z) 

Regla B : -> P(x) ===> Q(z) 

B ) Cuando en un sistema se evalúa una expresión no multivaluada, a veces el sistema se 
detiene al satisfacerse una regla que tiene certeza absoluta , ej: 

Regla A: P(x) ===> (z = A) FC=100 

Regla B: -> P(x) ===> (z = B) FC=100 

Regla C : S(y) ===> (z = C) FC= . . . 

si z sólo puede asumir un valor, la Regla C nunca se satisface si el mecanismo de 
inferencia activa las reglas en ese orden secuencial, y se detiene al satisfacerse una de 
las reglas A o B que tienen certeza absoluta . 


9. HERRAMIENTAS DE DESARROLLO 


9. 1. TIPOS DE HERRAMIENTA 

Para el desarrollo de un Sistema Experto se han utilizado diversos tipos de "herramienta", que se 
pueden clasificar en 5 categorías: 

1 - Lenguajes tradicionales, que son orientados a procesos numéricos (Pascal, C , etc ...) . 

2 - Lenguajes orientados a objetos (Smalltalk, Eiffel, C++, etc ...) . 

3 - Lenguajes orientados a manipulación simbólica como el LISP 

4 - Lenguaje de "programación lógica", PROLOG 

5 - Herramientas dedicadas para Sistemas Expertos (ingl.: "Expert System Shell") . 

En general, se recomienda utilizar herramientas dedicadas para el desarrollo de Sistemas Expertos, a 
no ser que tengamos un objetivo especial o académico, como por ejemplo investigar otras estructuras 
de datos , mecanismos de inferencia , o tratamientos de la incertidumbre , que las herramientas 
comerciales no nos ofezcan o no nos permitan explorarlas con tanta libertad como si las 
implementamos nosotros mismos . 

Aunque el prolog tiene algunas particularidades que lo hacen algo adecuado para implementar SS.EE. 
, también adolece de ciertas características implementadas ya en las SELLs para SS. EE. (Véase el 
artículo de Subrahmanyam citado en la bibliografía). 
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- Inductivas : Que tienen la capacidad de inducir reglas a partir de ejemplos. 

- Basadas en reglas simples. Que no organizan sus reglas dentro de módulos. 

- Basadas en reglas estructuradas. Que organizan sus reglas en grupos. 

- Híbridas: Que utilizan variadas estructuras de datos. 

- Específicas 


9. 2. SELECCION DE UNA HERRAMIENTA 

Los principales factores que se deben considerar en el momento de seleccionar una herramienta de 
desarrollo (shell) para implementar un Sistema Experto 
son las siguientes : 

- Que tenga suficiente potencia en cuanto a la capacidad para manejar una Base de Conocimientos del 

tamaño que nos interesa y con una buena velocidad de respuesta. 

- Que sea flexible para que el trabajo de desarrollo se pueda realizar ágilmente. 

- Que las estructuras que usa para representar el conocimiento sean adecuadas para el tipo de problema 

que deseamos resolver. 

- Que los métodos de razonamiento que utiliza también sean adecuados al tipo de problema que 

enfrentamos. 

- Que las interfaces que ofrece ante el desarrollador y ante el usuario sean de fácil manejo y 

contribuyan a facilitar tanto el desarrollo como la explotación, en vez de dificultarlos. 

- Que ofrezca los interfaces necesarios con otros sistemas como: Procedimientos escritos en lenguajes 

de programación convencionales y Bases de Datos. 

- Que el proveedor respalde el producto con entrenamiento, asesoría y soporte. 

- Que el software funcione en la plataforma de hardware que tenemos disponible para el desarrollo y 

la posterior explotación del sistema. 

- Que los costos estén dentro del presupuesto destinado a este proyecto. 

Para un tratamiento en mayor profundidad sobre la selección de herramientas para SS.EE., véase el 
artículo de Stylianou, Madey y Smith referenciado en la bibliografía de este libro. 


10. IMPLEMENT ACION DE SISTEMAS 

EXPERTOS CON REDES NEURONALES 

10. 1 INTRODUCCION A LAS REDES NEURONALES ARTIFICIALES 

Paralelamente con la investigación típica de la I. A., que se centra en el desarrollo de modelos 
conceptuales y simbólicos, se han desarrollado sistemas análogos a las neuronas y sus redes, que 
resultan particularmente aptos para procesos de aprendizaje del tipo "mejora de habilidades" o 
"reconocimiento de patrones". 

La idea de buscar en la estructura de los sistemas nerviosos, una inspiración para la concepción de 
máquinas para el proceso de información, se remonta al año 1943, cuando W. McCulloch y S. Pitts 
propusieron un modelo de "neurona" para explicar cómo el cerebro podría realizar funciones 
booleanas. Luego de un período de gran actividad entre 1960 y 1970, orientados hacia los problemas 
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de clasificación y filtraje adaptativo, la investigación en este campo se volvió más lenta. En los años 
80 se abrieron nuevas perspectivas en este campo debido a : 


- La aplicación de conceptos de la física de sistemas caóticos a las arquitecturas de redes de neuronas 

formales, lo cual ha permitido analizar y prever cualitativamente el comportamiento de esos 
sistemas complejos y no lineales. 

- La introducción de métodos de aprendizaje aplicables a redes multicapa de neuronas, que 

sobrepasaron las limitaciones de las redes conocidas anteriormente. 

La Neurona o célula es el elemento básico de un sistema nervioso animal, cada una recibe influjos 
nerviosos através de ramas denominadas Dendritas, cada neurona saca sus propios influjos de salida 
através de una fibra denominada Axón. Los impulsos se trans mi ten de una célula hacia otra pasando 
por uniones denominadas Sinápsis. Existen unas sustancias químicas, denominadas 
Neurotransmisores, que se liberan en las sinápsis y modifican el potencial eléctrico intracelular, 
aumentando o disminuyendo la probabilidad de que se origine un impulso nervioso. Si el potencial 
intracelular es inferior a cierto valor umbral, la neurona está en reposo, cuando supera ese umbral la 
neurona envía señal eléctrica. La neurona es un elemento no lineal que constantemente toma 
"decisiones" en función de sus entradas. 

Las neuronas se organizan en redes de tamaños variables, muy interconectadas, que constituyen 
verdaderos sistemas de tratamiento paralelo de información, y que tratan señales: Sensoriales, de 
comando motriz, de memoria, etc. Ciertas redes observables en la naturaleza poseen una estructura 
fija, resultante de la evolución de las especies, y del desarrollo del individuo, pero de todas maneras 
poseen capacidades adaptativas que les confieren posibilidad de aprendizaje. 

En las redes neuronales formales, artificiales, hallamos, aunque sea de una manera simplificada, una 
modelización de las principales características de lo que se sabe sobre las redes neuronales naturales: 
Procesadores simples, gran interconectividad, tratamiento paralelo y cooperativo, estructura fija o 
adaptativa y gran variedad de funciones. Sinembargo, el pequeño número de procesadores que 
podemos manejar aún, la simplicidad de nuestra "neurona" elemental, y la insuficiencia de las 
herra mi entas conceptuales, hacen que las redes neuronales artificiales estén aún muy lejos de alcanzar 
capacidades comparables con las de los animales aún más sencillos. 

Una neurona formal es un autómata simple, calcula su "potencial" de salida haciendo primero una 
suma ponderada de sus entradas. Los coeficientes de ponderación se denominan "coeficientes 
sinápticos", luego la salida (que constituye su "estado") es generada como una función, en general no 
lineal, del potencial. Esta función se denomina "función de transferencia". 

Una Red Neuronal realiza un "mapeado" continuo desde un espacio n-dimensional, de entrada , a uno 
m-dimensional , de salida , basándose en ejemplos de la acción del mapeado. 

Vi 


Vm 


La Red Neuronal está compuesta internamente por muchos Elementos Procesadores, que, a manera de 
"neuronas" están muy interconectados, teniedo cada interconexión determinada fuerza ( peso o 
poderación) . 
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Durante el aprendizaje en este tipo de sistemas se ajustan las parámetros de las relaciones matemáticas 
entre las entradas y salidas de cada elemento procesador. 

Las Redes Neuronales se usan típicamente para desarrollar una relación entre varias entradas y varias 
salidas. Al someter la red a un conjunto de entradas y su correspondiente conjunto de salida, la red 
ajusta sus conexiones según cierta "regla de aprendizaje" 


ESPECIFICACION DE UNA RED NEURONAL ARTIFICIAL 
La especificación de un R. N. A. consta de la definición de tres componentes: 


1 - ELEMENTO PROCESADOR ("neurona artificial", o "neurodo") : Especificación de la estructura 
del elemento procesador que es un nodo de la red. Asumimos por el momento que son 
iguales, se trata de una red con nodos homogéneos. 


h *2 *3 *n 



W] w 2 w 3 w n 

ponderaciones 

FUNCION SUMA 


FUNCION DE TRANSFERENCIA 


t 


V 


En esta especificación se establecen las funciones que relacionan las entradas a la neurona 
con las salidas, por ejemplo: Se puede componer de una primera función de SUMA o 
agregación: 
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S = Wo + W 1 X 1 + W 2 X 2 +...+ WnX n (siendo W¡ = ponderaciones, X¡ = 
entradas) 

y una segunda función, de TRANSFERENCIA, por ejemplo : 

Y_(i + e‘ s )-l (siendo Y = salida del elemento) 

2- NEURODINAMICA : Especificación de las reglas de aprendizaje o adaptación, según las cuales la 
red ajusta parametros internos W¡ como resultado de la experiencia. 

3 - TOPOLOGIA : Especificación de las interconexiones entre los elementos procesadores. 


Ejemplo 1: 



Ejemplo 2: 
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ENTRENA MI ENTO DE LA RED 

Inicialmente podemos tener la red configurada con unos parámetros de valores aleatorios, la cual 
sometemos a un período de aprendizaje, para obtener la red entrenada : 



Durante el entrenamiento o aprendizaje la red modifica parámetros internos W¡ basándose en la regla 

de aprendizaje, la cual tiene en cuenta la diferencia entre la respuesta que actualmente dió la red y la 
respuesta deseada. 


entradas 



Reglas de 


respuesta deseada 




Aprendizaje 


comparación^) 


ZZ 


Respuesta actual 


ARQUITECTURAS BASICAS 

Generalmente se puede advertir una organización de las neuronas en "capas" o niveles, un primer nivel 
es aquel cuyas neuronas reciben las entradas desde el exterior de la red. El último nivel es aquel cuyas 
neuronas entregan su salida al exterior de la red. Entre el primer nivel y el último pueden existir otras 
capas, que se denominan "capas ocultas" , Pueden existir sistemas sencillos , compuestos de una o 
dos capas. 
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Existen dos grandes tipos de arquitecturas de red: Con realimentación y sin realimentación. 

Las redes sin realimentación en general se limitan al "tratamiento de señales", en el sentido tradicional 
del término, y realizan pues funciones de filtro o de predictores. 

En las redes con realimentación algunas, o todas, las neuronas reciben en su entrada parte o la 
totalidad del estado de la red. Este tipo de red es un sistema dinámico no lineal. 

EJEMPLO : MODELO DE McCULLOCH-PITTS 

Se trata de una neurona determinista que funciona en tiempo discreto y con estados binarios. Se puede 
utilizar para clasificadores y memorias asociativas, se define por las relaciones siguientes: 

v(t) = 2 WjXj(t) 

s(t+dt) = +1 si v(t) > 0 

-1 en caso contrario 


s(t+dt) 


APRENDIZAJE EN REDES NEURONALES SIN RE ALIMENTACION 
Sea una red que posee más de una capa de neuronas. 

La salida Si de la i-ésima neurona está definida por : Si = Fi(vi) siendo vj = ^ WijXj 
Siendo: 

vi = potencial 

Fi() = función de activación o de transferencia 
Wij = ceficientes de ponderación 

La topología más general para una red estática sin realimentación es una completamente conectada, 
por ejemplo: 
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Las neuronas 2 y 4 son las "neuronas de salida", las 1 y 3 son "ocultas". 

El aprendizaje consiste en calcular los valores de los coeficientes W de tal manera que la red efectúe la 
tarea que se requiere (ej: clasificación, predicción, etc.). Para el entrenamiento la red se somete a P 
parejas de vectores, cada pareja se compone de un vector de entradas y un vector correspondiente de 
salidas. El algoritmo de aprendizaje debe calcular los coeficientes W de tal manera que para cada vector 
presentado a la entrada, las salidas sean lo más próximas posibles a los valores deseados. 

Los coeficientes sinápticos W se calculan tendiendo, por ejemplo a minimizar las diferencias entre el 
vector de salida deseado y el vector respuesta obtenido. Una de las reglas más simples utilizadas es : 

Wij(t+dt) = Wij(t) + a A(t) Xj(t) siendo a una constante 


10. 2. LA RED NEURONAL COMO SISTEMA EXPERTO 

Realmente, las Redes Neuronales Artificiales (R.N.A) . no fueron inventadas para hacer sistemas 
expertos, aunque en cierto sentido se pueden comportar como estos. Las R.N.A. ofrecen pues una 
alternativa para implementar la función de un sistema experto. 

Los principales pasos de implementación son los siguientes : 

1 - Identificar todos los atributos A¡ necesarios para resolver el problema, (ej: síntomas en un sistema 

de diagnóstico) . 

2 - Identificar los valores Vy asociados con cada atributo, o posibles características de los casos. 

3 - Identificar las posibles conclusiones o selecciones . 

4 - Escoger la red : 

- Tipo de elemento procesador. 

- Distribución de los elementos en capas de entrada, ocultas o intermedias, y de salida 

(inglés: "input layer", "hidden layer(s)", "output layer") . 

- Manera de codificar las características de los casos como valores de las entradas de los 

elementos de la capa de entrada . 

- Manera de codificar las selecciones de los casos como valores de las salidas de los 

elementos de la capa de salida . 

- Regla de aprendizaje, o sea el algoritmo según el cual se modificarán los pesos de 

interconexión entre los elementos. 
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5 - Utilizar un conjunto de casos ejemplo para entrenar la red . Los atributos y valores definen la capa 
de entrada de la red , mi entras los resultados forman la capa de salida 


Cuando se usan R.N.A., el dominio y la tarea no requieren ser tan bien comprendidos como para usar 
los "shells" tradicionales. No se requiere que el experto detalle cómo llega a una solución, ya que el 
sistema se adapta con base en las relaciones estímulo/respuesta, reconfigurándose para resolver el 
problema . La ventaja principal de usar este tipo de implementación es que no requiere algoritmos 
específicos del dominio ; otra ventaja consiste en que se pueden degradar más "grácilmente" que los 
sistemas expertos tradicionales si falla alguna parte (por ejemplo una conexión) . La principal 
desventaja es que no tenemos manera de examinar los "conocimientos" del sistema, y en este sentido 
es una especie de "caja negra", en el cual podemos confiar sólo por su comportamiento entrada/salida . 


11. SISTEMAS EXPERTOS PARA "TIEMPO 
REAL" 


Al evolucionar la metodología de los SS.EE. de un arte hacia una ciencia, cada vez se atacarán 
problemas más exigentes y desafiantes. Algunos de los ambientes más interesantes a este respecto son 
las tareas a realizarse en "tiempo real". 

Aunque se han propuesto varias definiciones de cuándo un sistema se considera de "tiempo real", 
tomemos la siguiente : Un sistema funciona en "tiempo real" cuando garantiza que procesa y responde 
dentro de un lapso de tiempo que ha sido prefijado como parte de la definición del problema . 

Un S.E. operando en una situación de tiempo real, por ejemplo reconocimiento de una amenaza en el 
campo militar, típicamente necesita responder a un ambiente cambiante, que involucra un flujo 
asincrónico de eventos y requisitos cambiantes, dentro de li mi taciones de tiempo, hardware y demás 
recursos. 

Para posibilitar el razonamiento necesariosobre datos rápidamente cambiantes, con requisitos estrictos 
de tiempo, se requiere una arquitectura flexible que maneje: razonamiento acerca del tiempo, 
razonamiento no-monotónico, interrupciones, y ruido en la entrada de datos, por ejemplo. 

Los sistemas de computadción en tiempo real han llegadoa ser parte indispensable de nuestra vida 
cotidiana, desde controladores pequeños y simples, hasta complejos sistemas industriales y militares. 
La complejidad de tales sistemas va en aumento, y se puede medir sobre tres dimensiones : 

1 - Número de factores a considerar antes de tomar la decisión. 

2 - Número de funciones a controlar. 

3 - Velocidad a la cual debe ejercerse las funciones de entrada, decisión y control. 

El deseo de atacar problemas de tiempo real más complejo a impulsado la aplicación de las técnicas de 
S.S.EE. a esos dominios. La aplicación de esas técnicas de solución de problemas deberán resultar en 
estrategias más sofisticadas para tareas como: control de satélites y aeronaves, vehiculos autónomos, 
monitoreo de redes de comunicación, robótica, control de procesos y monitoreo de pacientes, entre 
otros. 

Una razón importante para aplicar SS.EE. a tareas de tiempo real de monitoreo y control es el deseo de 
reducir la excesiva carga de señales sobre operarios, los cuales por este motivo pueden cometer 
costosos errores. Un planta de procesos industriales, fácilmente puede requerir atender a cientos o 
miles de variables para su operación óptima, las cuales usualmente deben ser atendidas por uno o unos 
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pocos operarios. Otro caso de potencial atractivo es el de los manejos de las bolsas de valores y 
negociaciones con monedas extranjeras, para la correcta toma de decisiones rápidas. 

La mayoría de los SS.EE. se han aplicado en tareas donde los datos son mas o menos estáticos y no se 
requieren respuestas dentro de lapsos críticos. Pero las aplicaciones en tiempo real (T.R.) presentan 
los siguientes características especiales : 

1- NO MONOTONICIDAD: 

Los datos provenientes de los sensores, así como las conclusiones no permanecen 
estáticos durante la ejecución del programa, los datos en general no son duraderos y su 
validez puede degradarse con el tiempo. 

2 - OPERACION CONTINUA : 

Muchos sistemas de T.R. deben continuar operando hasta que un operador los detenga, a 
no ser que ocurra un hecho catastrófico. 

3 - EVENTOS ASINCRONICOS : 

Aunque gran parte de la actividad de un sistema de T.R. se acomoda a una secuencia 
prefijada, frecuentemente el sistema también debe poder aceptar interrupciones (inglés: 
"interrupts") originadas por eventos externos que no se conforman a la secuencia. 

Adicionalmente, los eventos pueden variar en importancia. El sistema debe atender los 
eventos según prioridades determinadas por la importancia de cada evento, con la posible 
reprogramación de la atención a los eventos menos importantes. 

4 - INTERFACES CON SENSORES : 

Generalmente reciben sus datos directamente de un conjunto de sensores. 

5 - DATOS INCIERTOS O FALTANTES : 

La validez de los datos puede ser cuestionable por degradación de los sensores o por 
ruido. 

6-ALTA VELOCIDAD: 

Este es un requisito clave en muchos sistemas críticos. Por ejemplo, el "Asistente de 
Piloto" (" Pilot's Associate ") la Lockeed debe reconocer un objeto amenazante en unos 
100 milisegundos. 

7 - RAZONA MI ENTO REFERIDO AL TIEMPO : 

Capacidad de razonar acerca del pasado, presente y futuro de los procesos, y la secuencia 
en que deben ocurrir los eventos. 

8 - ENFOQUE DE LA ATENCION : 

Cuando ocurre un evento importante, el sistema debe enfocar sus recursos a determinado 
objetivo ; esto puede requerir : Activar una nueva "fuente de conocimineto " o 
"especialista", atender a otros sensores, o modificar la velocidad con la cual se están 
analizando ciertos datos. 

9 - TIEMPOS DE RESPUESTA GARANTIZADOS : 

El sistema debe responder antes de que se requiera su respuesta, o sino es inútil, pero 
además, es deseable que produzca la mejor respuesta posible dentro de ese límite de 
tiempo. 


10- INTEGRACION CON COMPONENTES PROCEDIMENTALES : 
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Generalmente iene que estar muy integrado con software convencional de tiempo real. Este 
código "convencional" realiza tareas como : proceso de señales, compresión de datos, 
extraciónm de parámetros, y funciones específicas de E/S . Esto requiere pues un 
integración eficiente de computación simbólica con numérica. 


12. TENDENCIAS DE LOS DESARROLLOS 

MAYOR ACCESIBILIDAD 

Las herramientas para desarrollo de S. E. serán más econó mi cas por la fuerza de la 
competencia, y estarán disponibles en mayor numero de plataformas de hardware. 

Asimismo se espera que sean más veloces y posean interfaces más "amigables" para con 
los desarrolladores y usuarios. 

HERRAMIENTAS ESPECIALIZADAS 

También crecerá la oferta de "shells" o herramientas especializados, orientados a cierto 
tipo de problema, por ejemplo: Diseño, Diagnóstico,... etc. 

ARQUITECTURAS HIBRIDAS 

Las herramientas más potentes ofrecerán múltiples formas de representar el conocimiento y 
de hacer inferencias. 

INTERACCION CON OTRO SOFTWARE 

Los S. E. estarán cada vez más difundidos, y se hallarán incorporados en equipos y 
software de uso más tradicional. La interacción de los Sistemas Expertos con Bases de 
Datos tendrá cada vez mayor importancia. 

UTILIZACION EN APLICACIONES DE TIEMPO REAL 

La existencia de S. E. suficientemente veloces aumentará la aplicabilidad de los S. E. en 
"tiempo real" como en el control de procesos (véase capítulo 12). 

AYUDAS AUTOMATICAS PARA LA ADQUISICION DEL CONOCIMIENTO 
Nuevos paquetes de software buscan integrar : 

- Técnicas de ayuda en la evocación de conocimientos (ej: Matrices de Conceptos) 

- Técnicas de análisis estadístico de datos ( ej: discriminante y de conglomerados 

(ing.: "cluster analysis"). 

- Algoritmos discentes , desarrollados en las investigaciones sobre el aprendizaje de 

la máquina (ingl.: "machine leaming") 

Con la integración de esas técnicas, se pretende desarrollar herramientas poderosas que 
agilicen la generación de Bases de Conocimientos. 

Las investigaciones que se hacen par facilitar la introducción de conocimientos al Sistema Experto, 
producirá eventualmente más sistemas que formen automáticamente (= aprendan) su Base de 
Conocimiento , así como herramientas donde el mismo experto, sin colaboración de un "ingeniero del 
conocimiento" pueda desarrollar un S. E. 


AYUDAS AUTOMATICAS PARA LA VERIFICACION DE LA BASE DE CONOCIMIENTOS 
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